本簡報以 16:9 橫向為主
請旋轉手機
或改用平板 / 桌機觀看
Part 3 開場:D06 用 8 小時,把 CSV / Excel / 客戶意見三種混亂資料源,從手動修一週變成 AI 跑半小時、人覆核 15 分鐘的標準流程。
髒資料是現代工作的隱形稅— 看不到金額,但每月吃掉三成產出。
—— 資料清理的第一步不是打開 AI,而是先決定你要什麼結構。欄位怎麼命名、每列代表什麼,這些問題 AI 不會幫你問,但你不問它就亂答。
CSV / Excel / 客戶意見
從髒到乾淨
單次任務
變每週自動跑
表單 → AI
→ 通知
寫成可交接的
部門資產
13 頁概念 — 為什麼要清、五大欄位問題、三要素 Prompt、AI 四大風險、Eric CRM 求救實戰。
CSV、Excel、資料庫表 — 每一格都知道自己代表什麼。AI 可以直接清。
→ 直接寫清理規格 Prompt
客戶意見、評論、DM、訪談逐字稿 — 沒有欄位,得先「貼標籤」才能分析。
→ 先設計分類框架,再貼標
「2024/1/1」「Jan 1 2024」「20240101」混雜
請統一為 YYYY-MM-DD
空格、N/A、-、無 同時存在
請統一標為 null
「手機」「電話」「mobile」同為聯絡方式
給規則統一欄位名
「行銷」「Marketing」「mrk」代表同一分類
建標準清單後重貼
「台北市信義區忠孝東路 100 號」塞同一欄
拆成縣市/區/街道
三種分隔符 + 國碼不一 + 空值未標記。
每一筆髒一點,加起來就無法做客戶名單合併。
→ 第 09 頁示範如何用 Prompt 一次清乾淨
欄位名稱 + 範例值。讓 AI 知道你的 CSV 長什麼樣,每欄可能有哪幾種髒法。
每欄要長什麼樣 + 例外怎麼標(如 ERROR:原始值 / null)。不留白給 AI。
明確要求結構化輸出,不要讓它輸出自然語言說明 — 否則貼回 Excel 還要再剪一次。
AI 輸出列數和輸入不一致。清理前後必須對比列數。
相似但不同的標籤被合併,AI 猜錯分類而你沒發現。
少數資料不符合輸出規格,例如日期仍有例外沒被處理到。
AI 自行補了空值,但你沒察覺,導致資料被污染。
輸入 200 列、輸出也要 200 列。少一列代表 AI 靜默刪除,立即拒收。
用 Excel 的 COUNTIF / COUNTBLANK 確認清理前後空值數量是否合理 — 不應該突然變多或變少。
隨機抽 10 列,逐欄對照原始 vs 清理後。比看 AI 報告快 5 倍。
前同事 Eric 接手 30 人金融科技公司 CRM,匯出 200 筆客戶資料,欄位一團亂、有些值明顯錯、有些不確定能不能清掉。他不太敢 100% 信 AI。
→ 下三頁示範如何在 25 分鐘內,給他一份「AI 清理 + 人工覆核」SOP。
12 列 × 5 類問題打勾,標出每列病灶與最髒欄位 TOP 1。
含 self-check 三條:列數對比、需人工確認列出、變更摘要對應。
分流:「必須人工」vs「可信 AI」,5–8 個檢查項。
email LISA / lisi 等
name 含全形空格
phone / date / amount 多版本
email 拼錯、缺 .com、缺網域
amount = -500、重複客戶 C001/C012
下半天把 CH3-1 學的三要素 Prompt、五大欄位、四大風險、人工覆核,套到兩個真實工坊:混亂資料清理器(PRAC3-1)+ 客戶意見分類板(PRAC3-2)。
2.5 小時課堂 + 2 小時自學。把一份格式混亂的資料,用精確的 AI 清理指令變成可交付的乾淨表格。三組情境實戰:CRM 去重 / 銷售統一 / 問卷開放題。
從工作中抓真實 CSV,越亂越好練。
對照五大問題,把欄位病灶列出來。
三要素套用,工具會幫你組 Prompt。
比對前後 + 列欄位規格給未來維護用。
同一個人因為姓名空白、大小寫、email 大小寫不同,被當成三個人塞進 CRM。300 筆裡有 15–25% 是這類「假重複」。
三家門店銷售明細:日期有民國 / 西元 / 純月份三套,金額有 NT$ / 元 / w 三種寫法 — 貼進 Excel 樞紐會爆。
150 題開放題,注音文、錯字、無意義回應混雜。重點不是把「沒意見」刪掉,是分類它。
可做情緒/主題分析。注音文「ㄌ→了」要留清理備註。
「還可以」「NO」— 是明確態度但無內容。不能跟純標點同類。
「.」「?」「........」— 保留原文當資料品質指標。
拿到髒資料第一步—備份原檔成 _raw,再在副本動手。
寫清理 Prompt 必含—輸出格式 + 例外處理。
驗證 AI 輸出—列數對比 + 抽 10 筆人工比對。
遇到無法清的列—標 ERROR:原始值 不要丟掉。
每週都要清的固定格式—寫成可重用 Prompt + 排程跑。
下一個工坊不再是「整理欄位」,是「給一團文字貼標籤」— 客戶意見、評論、DM、工單。同樣的三要素,但要先設計分類框架。
2.5 小時課堂 + 2 小時自學。把一批非結構化的回饋文字,用 AI 自動分主題與情緒,輸出可分析的結構化資料。四種真實戰場:電商評論 / SaaS 工單 / 餐廳評論 / 品牌 DM。
「服務人員親切、問題都有耐心回答,很滿意這次的體驗」
「費用真的太貴,跟其他家比差太多」
「等待時間有點長,等了快一個小時」
這則回饋關於什麼—商品、客服、價格、物流。先給標準清單,不讓 AI 自創。
說話者什麼感受—正面、負面、中立、無意義。「+1」是 invalid 不是正面。
高(具體投訴要處理)/中(回應即可)/低(純心得)。決定誰要看到。
25 則商品頁留言,抱怨/讚美/中立混雜,還有一堆「好」「+1」「讚」。預期分布:正面 10 / 負面 8 / 中立 4 / 無意義 3。
產品異常 + 重現步驟 → RD
新功能 / 整合請求 → PM
使用教學 → CS
金流、發票 → Sales/CS
密碼、驗證 → CS
模糊或跨類 → 分流主管
→ 易漏點:「請問怎麼設定」是 how_to 不是 bug,丟 RD = 工程師做白工;T03「付了錢卡免費版」表面像 account,本質是金流 P0。
40 則 Google Map 評論。一則可能同時提食物、服務、環境、價格 2–3 個面向 — 不能只標整體情緒。
行銷主管
公關(先要作品集)
客服 SLA
小編可答
財務
HR / 制式回
不餵食(存證)
心心 / 輕量回
→ 「公司 50 人團購」走 biz_collab 不是 inquiry;「超爛」沒具體內容是 troll 不是 complaint,不要當客訴進 SLA。
「+1」「.」「無」要保留原文當資料品質指標。invalid 超過 20% 是題目設計問題,不是清理不夠。
不給標準清單,AI 會自己想出 20 種主題分類,下次跑又變另外 20 種。分析師看不出趨勢。
一則評論可能是「服務 +1 但價格 −1」。只標 +1 會錯失改善訊號 — 隱性改善清單跑不出來。
八小時走完 D06:CSV 清理三要素、AI 四大風險、五類診斷、四種分類戰場。下一頁回頭看今天的節奏。
Part 3 全景 + D06 任務說明
五大欄位 + 三要素 Prompt + 四大風險 + Eric SOP
CRM 去重 / 銷售統一 / 問卷開放題
電商 / SaaS / 餐廳 / 小編 DM
交付確認 + D07 預告
針對你工作中那份髒表,含五大問題對應規則 + 例外處理。
分流「必須人工」vs「可信 AI」,5–8 個檢查項。
主題清單 + 情緒清單 + 可操作性等級,給未來分類器用。
把今天遇到的「跨類別」「無意義」「troll」案例整理成偵測規則。
手動跑一次清理 / 分類 — 給一份髒資料,貼進 ChatGPT,貼回 Excel。每次 10 分鐘。
CH3-2 + CH3-3:把今天的 Prompt 包成 webhook + 排程 + 通知。每週 100 個檔案自動清完,只回報 3–5 筆需人工。
D07 — 把資料清理變成工作流自動化。同一份 Prompt 從手動跑變每週排程跑,從個人技能變團隊資產。