Gemini Prompt 教學:用 Google 生態與多模態指令省下一半作業時間

這篇解決什麼問題? 很多人把 Gemini 當成「另一個聊天機器人」,只丟一句問題就期待好結果,白白浪費了它最強的兩個能力:原生多模態與深度整合 Google 生態。這篇文章適合誰讀? 行銷、客服、營運與企業 IT 導入負責人——只要你的工作每天要處理圖片、PDF、試算表、Gmail 與簡報,就值得看。讀完你會得到什麼? 一套可直接複製的 Gemini Prompt 範本、一張 Workflow 流程圖,以及把繁瑣作業時間砍半的具體方法。

為什麼要重新學 Gemini 的 Prompt?

大多數 Prompt 教學都是繞著純文字對話打轉,但 Gemini 的設計重點從一開始就不只是文字。它有兩個關鍵差異,會直接改變你下指令的方式:

第一,原生多模態。Gemini 不是「先把圖片轉成文字再處理」,而是同時理解文字、圖片、PDF、表格甚至影片畫面。這代表你可以把一張產品照、一份報價 PDF、一份客戶回饋試算表一起丟給它,要它做跨來源的綜合判斷。如果你想更系統地理解「模型同時看圖讀字」這件事的運作邏輯,建議先讀 多模態 AI 應用指南,再回來看怎麼把它變成可操作的指令。

第二,超長上下文與 Google 生態整合。Gemini 能一次吃下整份合約、整本產品手冊;在 Google Workspace 裡,它還能直接讀你的 Gmail、Docs 與試算表。對台灣中小企業來說,這意味著不必再導入複雜系統,只要把 Prompt 寫好,現有的 Google 帳號就是你的自動化平台。

要強調一個常被忽略的觀念:Prompt 寫法的核心原則跨模型相通,差異在於各家模型的「強項區」。ChatGPT 擅長對話式推理與外掛生態,Claude 擅長長文與嚴謹結構,Gemini 則在多模態與 Google 整合上佔優。與其每換一個工具就重學一次,不如先掌握共通骨架,再針對 Gemini 的強項加碼。想做跨模型對照,可同時參考 ChatGPT Prompt 教學Claude Prompt 教學,你會發現三者的「結構化思維」高度一致。

核心概念:把 Gemini 當成有眼睛的分析師

與其把 Gemini 想成聊天機器人,不如把它想成一位同時有眼睛、會讀檔案、又坐在你 Google 帳號旁邊的分析師。你給這位分析師的指令越清楚、素材越完整,他的產出就越接近交付品質。

下面這張表整理了「隨便問」和「結構化指令」的差別:

面向隨便丟一句結構化 Gemini Prompt
角色沒指定,回答發散「你是資深電商文案」精準定位
素材純文字描述直接附圖片/PDF/試算表
格式自由發揮指定表格、JSON 或固定欄位
限制字數、語氣、禁用詞、事實來源
驗收看了再說要求自我檢查+標註不確定處

掌握這張表,就掌握了 Gemini Prompt 的精髓:角色 → 素材 → 格式 → 限制 → 驗收,五個環節缺一不可。這套骨架其實就是業界常見框架(RTF、CRISPE)的精簡版,如果你想把它擴成更完整、可套不同任務的模板,Prompt 工程框架 有更細的拆解。

實際教學

Step 1:開頭就鎖定角色與輸出格式

不要問「幫我寫產品介紹」,而要說「你是專攻台灣母嬰市場的資深電商文案,請用條列+一段總結的格式,輸出 3 個版本」。角色與格式越前面講越好,Gemini 會用它來決定整段回答的語氣與結構。若你是在團隊裡反覆使用同一個角色設定,更建議把角色寫進系統層,做法見 System Prompt 教學

Step 2:一次餵入多模態素材

這是 Gemini 最被低估的能力。把產品照片、競品報價 PDF、客服 Excel 一起上傳,然後下指令:「比對這三份資料,找出我們的價格與賣點差異」。你不需要先自己整理,讓它做跨來源整合,這正是純文字模型做不到的。重點是在文字裡逐一點名每個素材的用途,否則模型可能略過某張圖。

Step 3:給範例與硬性限制

提供 1-2 個你滿意的輸出範例(few-shot),並明確寫出限制:字數上限、必須用台灣用語、禁止出現「優惠」以外的促銷詞、不確定的數據要標註。範例比形容詞有用十倍——與其說「寫得專業一點」,不如貼一段你心中的好範本。這個「給示範」的技巧威力很大,獨立成篇的 Few-shot 範例教學 解釋了為什麼 2-3 個好範例往往勝過一大段抽象描述。

Step 4:串接 Google 生態

在 Google Workspace 的 Docs 或 Gmail 側邊欄打開 Gemini,直接下指令:「總結這封信串的待辦事項,列成表格」或「根據這份試算表的 Q2 數據,幫我寫一段給主管的摘要」。它讀的是你有權限的即時資料,省去複製貼上。想把這一步自動化成固定流程、套用別人驗證過的範本,可到 任務食譜書 找對應的工作流程。

Step 5:迭代與驗收

第一版幾乎不會完美。用追問修正:「第二版太正式,改口語一點」「把第 3 點的數字來源標出來」。最後加一句驗收指令:「請檢查以上內容有沒有與我提供的檔案矛盾,列出不確定的地方」,讓它自我審查再交付。這個收尾動作能擋掉大部分幻覺。

進階:更深入的一層

掌握五步骤後,多數人會卡在同一個地方:任務一複雜,單一 Prompt 就開始失控。這一節談三個能讓你從「會用」進階到「用得穩」的關鍵手法。

一、把長上下文當「工作記憶」而非「垃圾桶」。 Gemini 能吃下整本手冊不代表你該把所有東西一股腦塞進去。模型對「上下文中段」的注意力通常弱於開頭與結尾(俗稱 lost in the middle)。實務做法是:把最關鍵的指令與最重要的素材放在 Prompt 的最前面或最後面,中段放參考資料,並在結尾重述一次任務目標。對於超長 PDF,先請它「先做一份分頁重點索引」,再針對需要的頁碼追問,效果遠勝一次要它讀完並回答。

二、用「思考步驟外顯」逼出推理品質。 面對需要比對、計算、分類的任務,在 Prompt 加一句「請先一步步列出你的分析過程,再給結論」,會明顯提升正確率。這也方便你檢查它哪一步推錯。若任務涉及多模態比對(看圖+讀表),更要求它「逐張圖、逐欄位說明依據」。

三、區分「事實型」與「創意型」任務,給不同的限制。 事實型(如財報摘要、合約條款抽取)要把溫度壓低、強制「資料中沒有就標註待確認」;創意型(如廣告標題、貼文)才放寬語氣、要它一次多給幾個版本。把這兩類任務混在同一段 Prompt,產出往往兩頭不到位。

下表整理三家主流模型在實務任務上的取向差異,幫你決定「哪一步該交給 Gemini」:

情境GeminiChatGPTClaude
一次讀多張圖+表格做比對強項,原生多模態可用可用
直接讀 Gmail/Docs/Sheets強項,Workspace 原生需外掛需外掛
超長合約/手冊全文理解強項,長上下文中等強項
嚴謹長文與結構化輸出中上中上強項
對話式逐步推理與外掛中上強項中上

結論很清楚:多模態與 Google 整合的環節交給 Gemini,其餘步驟視情況分工。這種「依強項分配任務」的做法,本身就是 Prompt 工程框架 強調的設計思維。

範例:Prompt 與 Workflow

下面是一個可直接複製的多模態 Gemini Prompt 範本,用於「看圖+讀數據,產出電商商品文案」:

# 角色
你是專攻台灣電商的資深商品文案,熟悉蝦皮與官網的轉換寫法。

# 任務
我已上傳:
1. 一張產品主圖
2. 一份競品價格 PDF
3. 一份過去客戶評論的試算表

請依下列步驟產出(每一步先列出依據再給結論):
(1) 從圖片描述產品的 3 個視覺賣點
(2) 對照 PDF,指出我們相對競品的價格優勢一句話
(3) 從評論試算表萃取顧客最常提到的 2 個好處
(4) 綜合以上,寫出 3 個版本的商品標題(各 ≤ 28 字)與一段 100 字內文

# 限制
- 全程繁體中文台灣用語,禁用簡體與中國慣用詞
- 不得編造規格;資料中沒有的數據標註「待確認」
- 語氣親切但不浮誇,禁用「全網最低」等誇大字眼

# 驗收
最後檢查產出是否與我提供的三份檔案一致,列出任何不確定處。

如果你想把這個範本「角色」抽出來、變成整個對話都生效的設定,可改寫成系統層指令,做法見 System Prompt 教學;想一次生成多個變體範本,則交給 Prompt 產生器

對應的自動化 Workflow,可以這樣串起來(文字版流程圖):

收集素材(產品圖+競品 PDF+評論表)

上傳至 Gemini 並送出多模態 Prompt

Gemini 跨來源分析,逐步列依據後產出 3 版文案草稿

編輯人工挑版+微調(追問迭代)

Gemini 自我驗收事實一致性,標註待確認項

定稿回填至 Google Docs/上架後台

想把這類流程接成可重複套用的標準作業,任務食譜書 裡有現成的多模態工作流可以照抄。

常見錯誤

最佳實務

實際案例:台中某電商品牌的商品上架流程

一家台中經營母嬰用品的電商團隊,過去每上架一支新品,要由一位編輯手動比對競品價格、翻評論、寫文案,整套流程耗時且容易遺漏。

導入前:

導入後(採用上述多模態 Gemini Prompt 範本+Google Workspace 流程):

關鍵不在「用了 Gemini」,而在於團隊把多模態素材整合結構化指令+驗收環節標準化成可重複的範本。

第二個案例:台北 B2B 客服信件分流

另一個值得參考的情境,是台北一家做工業設備的 B2B 公司。他們的客服信箱每天湧入上百封詢價、報修與規格詢問信,過去靠一位專員逐封分類、轉派給對應業務,平均每封處理約 4 分鐘,且常因人力波動而積壓。

導入做法很單純:在 Gmail 側邊欄用 Gemini,搭配一段固定的系統層指令,要它「讀取信件內容與附件 PDF,判斷類別(詢價/報修/規格/其他)、抽取客戶公司與聯絡人、給出建議轉派對象,輸出成固定欄位表格」。因為涉及機密客戶資料,他們特別在系統指令裡鎖定「只依信件內容判斷、不得臆測、敏感資訊不外流」,這套邊界寫法正是 System Prompt 教學 的核心。

成效:

指標導入前導入後
每封信平均處理時間約 4 分鐘約 1 分鐘
分類正確率人工約 90%模型初判約 92%,人工只需抽查
尖峰積壓常見大幅緩解

這個案例的啟示是:Gemini 在 Google 生態裡的最大價值,往往不是「寫得多漂亮」,而是把原本卡在人力的分流與整理環節自動化。想把這類流程模組化、串成完整管線,可到 任務食譜書 取用現成範本。

免責聲明:本文涉及財務、法律與醫療等內容僅供流程示範,不構成投資、法律或醫療建議,實際應用請諮詢專業人士並人工複核。

結論

Gemini 的價值不在於「會聊天」,而在於它能同時看圖、讀檔、串接你既有的 Google 工作環境。只要把指令寫成「角色 → 素材 → 格式 → 限制 → 驗收」五步結構,再善用多模態與長上下文、把關鍵指令放在頭尾、複雜任務要求外顯推理,就能把過去半天的作業壓縮到一兩小時。

下一步建議:先拿本文的 Prompt 範本套用到你最常做的一項重複工作,跑通後存成團隊模板。接著用 Prompt 工程框架 把這套結構擴成可套不同任務的模板,做 ChatGPT Prompt 教學 的跨模型對照找出各步該交給誰,最後到 任務食譜書 找現成流程直接套用。把 Prompt 寫對,現有的 Google 帳號就是你最低成本的 AI 自動化平台。

❓ 常見問題 FAQ

Gemini Prompt 和 ChatGPT 的寫法一樣嗎?
核心原則相通,但 Gemini 的長上下文原生多模態更強,適合一次餵入大量檔案與圖片。建議搭配我們的 ChatGPT Prompt 教學對照學習,也可一併看 Claude Prompt 教學了解三家模型的脾性差異。
免費版 Gemini 可以用這些技巧嗎?
可以。多模態與長上下文在免費版多半可用,只是配額較低、處理超長檔案時可能被截斷。企業導入建議升級到付費方案以取得更穩定的速率與資料治理。
Gemini 能直接讀我的 Google 試算表嗎?
在 Google Workspace 的側邊欄 Gemini 中可以直接存取你有權限的 Docs、Sheets 與 Gmail,無需手動複製貼上。前提是你的帳號已開通對應功能。
上傳機密檔案安全嗎?
企業版(Gemini for Workspace)的內容不會被用於訓練模型。但仍建議遵守公司資料政策,敏感個資先去識別化,並參考 System Prompt 教學用系統層指令鎖定資料邊界。
為什麼 Gemini 有時會編造資訊?
這是大型語言模型的通病。請在 Prompt 中要求「只根據我提供的資料回答,找不到就說沒有」,並人工複核關鍵數據。搭配 Few-shot 範例教學給出正確示範,能進一步壓低幻覺率。
多模態 Prompt 要怎麼寫圖片才不會被略過?
關鍵是在文字裡明確點名素材,例如「根據第 2 張圖的標籤」「依這份 PDF 第 3 頁的表格」。更系統化的圖像描述寫法,可參考 多模態 AI 應用指南AI 生圖 Prompt 教學
我想用同一套 Prompt 結構處理不同任務,有框架可循嗎?
有。建議套用 Prompt 工程框架裡的 RTF、CRISPE、TAG 等模板,把「角色→素材→格式→限制→驗收」固定下來,再用 Prompt 產生器批次生成。
Gemini 適合接進 AI Agent 工作流嗎?
適合,尤其是需要多模態理解的環節。可到 任務食譜書找現成流程,把它嵌入自動化管線,再用系統指令固定每一步的輸入輸出。

🔗 延伸閱讀

幫這篇打個分:
A
AgentAI 智庫團隊 ✓ 台灣實作團隊

我們是一群專注於 AI Agent、Prompt 與自動化工作流的台灣實作者。每篇教學都附可複製配方、誠實標示實測程度與限制,只分享真正能落地、可直接套用的方法——與其介紹工具,不如教你把事情做完。

關於我們 →看更多教學 →訂閱情報週報 →

每週把這類實戰教學寄給你

訂閱 AgentAI 智庫情報週報,新的 Prompt、AI Skills、工作流與教學第一時間收到。

免費 · 隨時取消