這篇解決什麼問題? 很多人把 Gemini 當成「另一個聊天機器人」,只丟一句問題就期待好結果,白白浪費了它最強的兩個能力:原生多模態與深度整合 Google 生態。這篇文章適合誰讀? 行銷、客服、營運與企業 IT 導入負責人——只要你的工作每天要處理圖片、PDF、試算表、Gmail 與簡報,就值得看。讀完你會得到什麼? 一套可直接複製的 Gemini Prompt 範本、一張 Workflow 流程圖,以及把繁瑣作業時間砍半的具體方法。
為什麼要重新學 Gemini 的 Prompt?
大多數 Prompt 教學都是繞著純文字對話打轉,但 Gemini 的設計重點從一開始就不只是文字。它有兩個關鍵差異,會直接改變你下指令的方式:
第一,原生多模態。Gemini 不是「先把圖片轉成文字再處理」,而是同時理解文字、圖片、PDF、表格甚至影片畫面。這代表你可以把一張產品照、一份報價 PDF、一份客戶回饋試算表一起丟給它,要它做跨來源的綜合判斷。如果你想更系統地理解「模型同時看圖讀字」這件事的運作邏輯,建議先讀 多模態 AI 應用指南,再回來看怎麼把它變成可操作的指令。
第二,超長上下文與 Google 生態整合。Gemini 能一次吃下整份合約、整本產品手冊;在 Google Workspace 裡,它還能直接讀你的 Gmail、Docs 與試算表。對台灣中小企業來說,這意味著不必再導入複雜系統,只要把 Prompt 寫好,現有的 Google 帳號就是你的自動化平台。
要強調一個常被忽略的觀念:Prompt 寫法的核心原則跨模型相通,差異在於各家模型的「強項區」。ChatGPT 擅長對話式推理與外掛生態,Claude 擅長長文與嚴謹結構,Gemini 則在多模態與 Google 整合上佔優。與其每換一個工具就重學一次,不如先掌握共通骨架,再針對 Gemini 的強項加碼。想做跨模型對照,可同時參考 ChatGPT Prompt 教學 與 Claude Prompt 教學,你會發現三者的「結構化思維」高度一致。
核心概念:把 Gemini 當成有眼睛的分析師
與其把 Gemini 想成聊天機器人,不如把它想成一位同時有眼睛、會讀檔案、又坐在你 Google 帳號旁邊的分析師。你給這位分析師的指令越清楚、素材越完整,他的產出就越接近交付品質。
下面這張表整理了「隨便問」和「結構化指令」的差別:
| 面向 | 隨便丟一句 | 結構化 Gemini Prompt |
|---|---|---|
| 角色 | 沒指定,回答發散 | 「你是資深電商文案」精準定位 |
| 素材 | 純文字描述 | 直接附圖片/PDF/試算表 |
| 格式 | 自由發揮 | 指定表格、JSON 或固定欄位 |
| 限制 | 無 | 字數、語氣、禁用詞、事實來源 |
| 驗收 | 看了再說 | 要求自我檢查+標註不確定處 |
掌握這張表,就掌握了 Gemini Prompt 的精髓:角色 → 素材 → 格式 → 限制 → 驗收,五個環節缺一不可。這套骨架其實就是業界常見框架(RTF、CRISPE)的精簡版,如果你想把它擴成更完整、可套不同任務的模板,Prompt 工程框架 有更細的拆解。
實際教學
Step 1:開頭就鎖定角色與輸出格式
不要問「幫我寫產品介紹」,而要說「你是專攻台灣母嬰市場的資深電商文案,請用條列+一段總結的格式,輸出 3 個版本」。角色與格式越前面講越好,Gemini 會用它來決定整段回答的語氣與結構。若你是在團隊裡反覆使用同一個角色設定,更建議把角色寫進系統層,做法見 System Prompt 教學。
Step 2:一次餵入多模態素材
這是 Gemini 最被低估的能力。把產品照片、競品報價 PDF、客服 Excel 一起上傳,然後下指令:「比對這三份資料,找出我們的價格與賣點差異」。你不需要先自己整理,讓它做跨來源整合,這正是純文字模型做不到的。重點是在文字裡逐一點名每個素材的用途,否則模型可能略過某張圖。
Step 3:給範例與硬性限制
提供 1-2 個你滿意的輸出範例(few-shot),並明確寫出限制:字數上限、必須用台灣用語、禁止出現「優惠」以外的促銷詞、不確定的數據要標註。範例比形容詞有用十倍——與其說「寫得專業一點」,不如貼一段你心中的好範本。這個「給示範」的技巧威力很大,獨立成篇的 Few-shot 範例教學 解釋了為什麼 2-3 個好範例往往勝過一大段抽象描述。
Step 4:串接 Google 生態
在 Google Workspace 的 Docs 或 Gmail 側邊欄打開 Gemini,直接下指令:「總結這封信串的待辦事項,列成表格」或「根據這份試算表的 Q2 數據,幫我寫一段給主管的摘要」。它讀的是你有權限的即時資料,省去複製貼上。想把這一步自動化成固定流程、套用別人驗證過的範本,可到 任務食譜書 找對應的工作流程。
Step 5:迭代與驗收
第一版幾乎不會完美。用追問修正:「第二版太正式,改口語一點」「把第 3 點的數字來源標出來」。最後加一句驗收指令:「請檢查以上內容有沒有與我提供的檔案矛盾,列出不確定的地方」,讓它自我審查再交付。這個收尾動作能擋掉大部分幻覺。
進階:更深入的一層
掌握五步骤後,多數人會卡在同一個地方:任務一複雜,單一 Prompt 就開始失控。這一節談三個能讓你從「會用」進階到「用得穩」的關鍵手法。
一、把長上下文當「工作記憶」而非「垃圾桶」。 Gemini 能吃下整本手冊不代表你該把所有東西一股腦塞進去。模型對「上下文中段」的注意力通常弱於開頭與結尾(俗稱 lost in the middle)。實務做法是:把最關鍵的指令與最重要的素材放在 Prompt 的最前面或最後面,中段放參考資料,並在結尾重述一次任務目標。對於超長 PDF,先請它「先做一份分頁重點索引」,再針對需要的頁碼追問,效果遠勝一次要它讀完並回答。
二、用「思考步驟外顯」逼出推理品質。 面對需要比對、計算、分類的任務,在 Prompt 加一句「請先一步步列出你的分析過程,再給結論」,會明顯提升正確率。這也方便你檢查它哪一步推錯。若任務涉及多模態比對(看圖+讀表),更要求它「逐張圖、逐欄位說明依據」。
三、區分「事實型」與「創意型」任務,給不同的限制。 事實型(如財報摘要、合約條款抽取)要把溫度壓低、強制「資料中沒有就標註待確認」;創意型(如廣告標題、貼文)才放寬語氣、要它一次多給幾個版本。把這兩類任務混在同一段 Prompt,產出往往兩頭不到位。
下表整理三家主流模型在實務任務上的取向差異,幫你決定「哪一步該交給 Gemini」:
| 情境 | Gemini | ChatGPT | Claude |
|---|---|---|---|
| 一次讀多張圖+表格做比對 | 強項,原生多模態 | 可用 | 可用 |
| 直接讀 Gmail/Docs/Sheets | 強項,Workspace 原生 | 需外掛 | 需外掛 |
| 超長合約/手冊全文理解 | 強項,長上下文 | 中等 | 強項 |
| 嚴謹長文與結構化輸出 | 中上 | 中上 | 強項 |
| 對話式逐步推理與外掛 | 中上 | 強項 | 中上 |
結論很清楚:多模態與 Google 整合的環節交給 Gemini,其餘步驟視情況分工。這種「依強項分配任務」的做法,本身就是 Prompt 工程框架 強調的設計思維。
範例:Prompt 與 Workflow
下面是一個可直接複製的多模態 Gemini Prompt 範本,用於「看圖+讀數據,產出電商商品文案」:
# 角色
你是專攻台灣電商的資深商品文案,熟悉蝦皮與官網的轉換寫法。
# 任務
我已上傳:
1. 一張產品主圖
2. 一份競品價格 PDF
3. 一份過去客戶評論的試算表
請依下列步驟產出(每一步先列出依據再給結論):
(1) 從圖片描述產品的 3 個視覺賣點
(2) 對照 PDF,指出我們相對競品的價格優勢一句話
(3) 從評論試算表萃取顧客最常提到的 2 個好處
(4) 綜合以上,寫出 3 個版本的商品標題(各 ≤ 28 字)與一段 100 字內文
# 限制
- 全程繁體中文台灣用語,禁用簡體與中國慣用詞
- 不得編造規格;資料中沒有的數據標註「待確認」
- 語氣親切但不浮誇,禁用「全網最低」等誇大字眼
# 驗收
最後檢查產出是否與我提供的三份檔案一致,列出任何不確定處。
如果你想把這個範本「角色」抽出來、變成整個對話都生效的設定,可改寫成系統層指令,做法見 System Prompt 教學;想一次生成多個變體範本,則交給 Prompt 產生器。
對應的自動化 Workflow,可以這樣串起來(文字版流程圖):
收集素材(產品圖+競品 PDF+評論表)
↓
上傳至 Gemini 並送出多模態 Prompt
↓
Gemini 跨來源分析,逐步列依據後產出 3 版文案草稿
↓
編輯人工挑版+微調(追問迭代)
↓
Gemini 自我驗收事實一致性,標註待確認項
↓
定稿回填至 Google Docs/上架後台
想把這類流程接成可重複套用的標準作業,任務食譜書 裡有現成的多模態工作流可以照抄。
常見錯誤
- 把多模態當成裝飾:只上傳圖片卻沒在 Prompt 裡明確要它「分析圖片」,Gemini 可能略過。一定要用文字點名素材,圖像描述的細節寫法見 AI 生圖 Prompt 教學。
- 一次問太多又沒結構:把十件事塞進一句話,回答會雜亂。改用編號步驟拆解任務。
- 把關鍵指令埋在超長上下文中段:模型容易在中段失焦,重要指令請放開頭或結尾並重述一次。
- 不給範例只給形容詞:「寫得有質感一點」這種指令幾乎無效,貼一個範本比形容詞精準得多。
- 完全相信輸出不複核:Gemini 仍會產生幻覺,財務、法律、醫療相關內容務必人工查證。
- 忽略台灣用語:不加限制時模型容易冒出「視頻」「質量」「信息」等中國慣用詞,要在 Prompt 明確禁止。
最佳實務
- 角色與格式放最前面:開頭就定錨,後續回答品質明顯提升。
- 善用長上下文但別塞滿:一次餵入完整資料讓它通盤理解,但把最重要的指令放頭尾。
- 多模態要明確點名:清楚說「根據第 2 張圖」「依這份 PDF 第 3 頁」。
- 要求外顯推理:複雜任務加一句「先列分析過程再給結論」,正確率與可檢查性都上升。
- 建立可重複的 Prompt 範本:把成功的指令存成模板,讓全團隊共用,可搭配 Prompt 產生器 快速產出。
- 加上自我驗收環節:每個重要產出都要求 Gemini 自查事實與格式。
- 在 Workspace 內整合:能直接讀 Google 檔案就不要複製貼上,減少出錯。
實際案例:台中某電商品牌的商品上架流程
一家台中經營母嬰用品的電商團隊,過去每上架一支新品,要由一位編輯手動比對競品價格、翻評論、寫文案,整套流程耗時且容易遺漏。
導入前:
- 每支商品文案製作約需 6 小時(找競品、讀評論、寫稿、校對)
- 每週只能上架約 8 支新品
- 文案常出現中國慣用詞,需主管二次校對
導入後(採用上述多模態 Gemini Prompt 範本+Google Workspace 流程):
- 每支商品文案製作降到約 2.5 小時,時間省下約 58%
- 每週上架量提升到約 18 支
- 在 Prompt 內鎖定台灣用語後,二次校對需求下降約 70%
關鍵不在「用了 Gemini」,而在於團隊把多模態素材整合與結構化指令+驗收環節標準化成可重複的範本。
第二個案例:台北 B2B 客服信件分流
另一個值得參考的情境,是台北一家做工業設備的 B2B 公司。他們的客服信箱每天湧入上百封詢價、報修與規格詢問信,過去靠一位專員逐封分類、轉派給對應業務,平均每封處理約 4 分鐘,且常因人力波動而積壓。
導入做法很單純:在 Gmail 側邊欄用 Gemini,搭配一段固定的系統層指令,要它「讀取信件內容與附件 PDF,判斷類別(詢價/報修/規格/其他)、抽取客戶公司與聯絡人、給出建議轉派對象,輸出成固定欄位表格」。因為涉及機密客戶資料,他們特別在系統指令裡鎖定「只依信件內容判斷、不得臆測、敏感資訊不外流」,這套邊界寫法正是 System Prompt 教學 的核心。
成效:
| 指標 | 導入前 | 導入後 |
|---|---|---|
| 每封信平均處理時間 | 約 4 分鐘 | 約 1 分鐘 |
| 分類正確率 | 人工約 90% | 模型初判約 92%,人工只需抽查 |
| 尖峰積壓 | 常見 | 大幅緩解 |
這個案例的啟示是:Gemini 在 Google 生態裡的最大價值,往往不是「寫得多漂亮」,而是把原本卡在人力的分流與整理環節自動化。想把這類流程模組化、串成完整管線,可到 任務食譜書 取用現成範本。
免責聲明:本文涉及財務、法律與醫療等內容僅供流程示範,不構成投資、法律或醫療建議,實際應用請諮詢專業人士並人工複核。
結論
Gemini 的價值不在於「會聊天」,而在於它能同時看圖、讀檔、串接你既有的 Google 工作環境。只要把指令寫成「角色 → 素材 → 格式 → 限制 → 驗收」五步結構,再善用多模態與長上下文、把關鍵指令放在頭尾、複雜任務要求外顯推理,就能把過去半天的作業壓縮到一兩小時。
下一步建議:先拿本文的 Prompt 範本套用到你最常做的一項重複工作,跑通後存成團隊模板。接著用 Prompt 工程框架 把這套結構擴成可套不同任務的模板,做 ChatGPT Prompt 教學 的跨模型對照找出各步該交給誰,最後到 任務食譜書 找現成流程直接套用。把 Prompt 寫對,現有的 Google 帳號就是你最低成本的 AI 自動化平台。
❓ 常見問題 FAQ
Gemini Prompt 和 ChatGPT 的寫法一樣嗎?
免費版 Gemini 可以用這些技巧嗎?
Gemini 能直接讀我的 Google 試算表嗎?
上傳機密檔案安全嗎?
為什麼 Gemini 有時會編造資訊?
多模態 Prompt 要怎麼寫圖片才不會被略過?
我想用同一套 Prompt 結構處理不同任務,有框架可循嗎?
Gemini 適合接進 AI Agent 工作流嗎?
🔗 延伸閱讀
每週把這類實戰教學寄給你
訂閱 AgentAI 智庫情報週報,新的 Prompt、AI Skills、工作流與教學第一時間收到。
免費 · 隨時取消