寫 Prompt 想要 AI 模仿特定風格時,大多數人的直覺是「把風格用形容詞描述清楚」——專業、親切、簡潔、有溫度。結果你堆了一串形容詞,AI 還是給你一篇似是而非、明明照著做了卻就是不對味的東西。這篇文章要教你一條更有效的路——Few-shot 提示(Few-shot Prompting):與其用一堆規則描述你要什麼,不如直接丟給 AI 幾個範例,讓它看著你的示範依樣畫葫蘆。 適合已經會下基本指令、但一碰到「要有我的風格」「要照固定格式」就翻車的工作者,以及準備把 AI 產出接進正式流程、需要穩定一致輸出的團隊。讀完你會得到可直接複製的 Few-shot Prompt 模板、挑選範例的判斷原則、一套「測試→汰換範例」的收斂方法,以及一個進階的「動態檢索範例」做法,讓你的 Prompt 隨情境自動換上最對的示範。
為什麼描述一堆規則,AI 還是抓不到你的風格?
先講一個很多人都踩過的坑。假設你要 AI 幫你回覆客戶詢問,你下了這樣的指令:「請用專業、親切、簡潔的語氣回覆,要有禮貌、不要太官腔、結尾要關心對方。」聽起來很完整對吧?但跑出來的回覆,不是太制式像罐頭,就是熱情過頭一堆驚嘆號,總之就是「不像你會寫的」。
問題出在哪?風格這種東西,本質上很難用文字精準描述。 「親切」對你來說可能是用「我幫您看一下喔」這種口吻,對模型來說可能變成連發三個笑臉。形容詞是抽象的,每個人腦中的定義都不一樣,模型只能猜。你越想用規則把風格框死,就越會發現有些東西「只能意會、不能言傳」。
這時候 Few-shot 提示就派上用場了。它的核心邏輯是:與其告訴模型「該怎麼做」,不如直接給它看「做出來長什麼樣」。 人在學一項技能時也是這樣——學寫公文,看十篇範本比讀十條規則有用;學煮一道菜,看師傅做一次比背食譜步驟更快上手。模型同樣吃這一套,給它幾個高品質的「輸入→輸出」範例,它就能從中歸納出你沒明說、甚至你自己都講不清楚的風格特徵。
這也是 ChatGPT 提示詞指南 與 Prompt 工程框架 之後的一項關鍵進階功夫——當你發現再怎麼描述都講不清楚時,就是該換成「用範例教」的訊號。換個角度說,Few-shot 是把抽象的「規則描述」翻譯成具體的「行為示範」,而模型最擅長的,正是從具體樣本裡反推出隱藏的規律。
核心概念:Zero-shot、One-shot、Few-shot 差在哪?
要搞懂 Few-shot,先把它放回提示策略的光譜上看。所謂的「shot」,指的就是你在 Prompt 裡給了模型幾個範例。
| 策略 | 給幾個範例 | 適合的情境 | 比喻 |
|---|---|---|---|
| Zero-shot(零範例) | 0 個 | 任務常見、模型本來就會,例如翻譯、摘要 | 直接出題,沒給考古題 |
| One-shot(單範例) | 1 個 | 格式特殊、用一個範例就能講清楚 | 給一題例題再考你 |
| Few-shot(少量範例) | 2~5 個 | 風格要一致、要涵蓋幾種變化情境 | 給幾題例題,讓你抓到出題邏輯 |
關鍵差別在於:Zero-shot 靠的是模型既有的知識,Few-shot 靠的是你當場示範的樣板。 當任務本身很標準(例如「把這段英文翻成中文」),模型早就會了,給範例反而多餘。但當任務帶有「你的味道」——你的品牌語氣、你公司特有的回覆格式、你習慣的條列方式——這些是模型不可能事先知道的,這時就非得用範例教不可。
再補一個容易被忽略的觀念:Few-shot 教的不只是風格,更是「格式」。 如果你希望輸出永遠是「一句問候+三個重點+一句行動呼籲」的固定結構,與其用文字描述這個結構,不如給兩三個已經長這樣的範例,模型會自動把格式複製過去。這對需要穩定接進 Workflow 自動化的場景特別重要——格式穩,後面的程式才好解析。如果你要的不只是「長得像」,而是嚴格的 JSON、表格或欄位輸出,建議把 Few-shot 範例和 結構化輸出提示 一起用:範例負責示範「樣子」,明確的 schema 規則負責守住「合法性」。
Few-shot 在三大提示技巧裡的定位
很多人會把 Few-shot、思維鏈、Prompt 串接混為一談,其實它們各管一件事,搞清楚分工才知道什麼時候該用哪一個。
| 技巧 | 解決的核心問題 | 一句話定位 |
|---|---|---|
| Few-shot | 風格、語氣、格式「對不對味」 | 用範例教模型「模仿」 |
| 思維鏈 Chain-of-Thought | 推理、判斷「對不對」 | 讓模型「一步一步想」 |
| Prompt 串接 Chaining | 複雜任務「一次做不完」 | 把任務拆成「多段接力」 |
這三者不是互斥的,反而常常疊在一起用。最典型的就是「Few-shot+思維鏈」:你在每個範例裡不只給答案,還示範一段簡短的推理過程,模型就會連你的「思考方式」一起學起來——這在分類、評分、判斷類任務上特別有用,後面的進階段落會展開講。
實際教學:五步寫出有效的 Few-shot Prompt
Step 1:確認任務適不適合用 Few-shot
不是所有任務都需要範例。先問自己一個問題:「這件事的難點,是模型不會做,還是做得出來但不合我的味?」
如果是「不會做」——例如需要最新資料、需要算複雜的數學——那給範例沒用,你該補的是資料或工具。但如果是「做得出來但不對味」——風格不對、格式跑掉、語氣不一致——這正是 Few-shot 的主場。客服回覆、社群貼文、產品文案、資料整理成固定表格,這幾類都很適合。如果你還不確定怎麼把指令的骨架搭好,可以先回頭把 Prompt 工程框架 的基本結構打穩,再來疊 Few-shot。
Step 2:挑選 2 到 5 個高品質範例
這是整個流程最重要、也最被低估的一步。記住一句話:範例的品質,就是輸出品質的天花板。 你給模型看垃圾,它就還你垃圾的進階版。
挑範例有三個原則。第一,用你真正滿意的成品,最好是過去人工寫出來、品質有保證的真實案例,不要隨便編。第二,範例要涵蓋變化——如果你要回覆客戶,那就準備一個「詢問型」、一個「抱怨型」、一個「稱讚型」的範例,讓模型看到不同情境該怎麼應對。第三,寧缺勿濫,三個精挑細選的好範例,勝過十個品質參差的範例。
如果手邊真的沒有現成範例可挑,與其硬擠,不如先用 Meta Prompting 請 AI 幫你「依這個情境生成 3 組草稿範例」,再由你人工挑選潤飾成定稿——這比從零開始寫快得多,但定稿的把關權一定要握在自己手上。
Step 3:統一範例的格式與標籤
模型很聰明,但也很容易被混亂的格式搞糊塗。你要做的是把每一組範例用固定的結構包起來,讓模型一眼看出「這是輸入、那是輸出、這是要模仿的對象」。
最常用的做法是給每段加標籤,例如用「客戶訊息:」和「回覆:」當欄位名,每組範例之間空一行隔開。重點是所有範例都要長得一模一樣——同樣的標籤、同樣的分隔符、同樣的縮排。只要有一組格式跑掉,模型就可能學歪。
Step 4:組裝完整的 Few-shot Prompt
把零件拼起來,順序通常是:先給一句總指令 → 接上幾組範例 → 最後放真正要處理的輸入,並留一個空的輸出欄位讓模型接著寫。
這裡有個常被忽略的細節:待辦的輸入一定要和範例用同樣的格式呈現。如果你的範例都是「客戶訊息:……回覆:……」,那真正要處理的那筆,也要寫成「客戶訊息:(這次的內容)回覆:」並停在這裡,讓模型自然地接著補上回覆。格式一致,模型才知道要把答案填在哪。
Step 5:用新輸入測試,汰換拖後腿的範例
寫完不是結束,而是開始調校。拿幾筆範例裡沒出現過的新輸入去測,看模型的產出穩不穩、像不像。
如果某種情境老是失敗,通常代表你的範例沒涵蓋到那種變化,補一個對應的範例進去。如果加了某個範例後整體變差,那這個範例可能風格不一致,把它換掉。這個「測試→找出問題範例→汰換」的循環跑個兩三輪,你的 Few-shot Prompt 就會收斂到非常穩定的狀態。這套思路和 Prompt 串接 裡「加檢核與回退」的精神是相通的——都是靠驗證來逼近穩定。
範例:可複製的 Prompt 與 Workflow 流程圖
以下是一個客服回覆的 Few-shot Prompt 模板,你可以直接複製,把範例換成自己公司的真實案例:
你是我們品牌的客服人員。請參考以下範例的「語氣」與「格式」,回覆最後一則客戶訊息。
語氣原則:親切、不官腔、先同理再解決、結尾關心對方。
---
客戶訊息:請問我昨天下的訂單什麼時候會出貨?
回覆:您好~幫您查了一下,您的訂單已經在備貨中,預計明天就會出貨喔!出貨後系統會自動寄送追蹤碼給您,請再留意一下信箱。如果還有任何問題,隨時告訴我們:)
---
客戶訊息:收到的商品有瑕疵,我很不滿意!
回覆:真的很抱歉讓您收到有瑕疵的商品,這不是我們希望您有的體驗。我們會立刻為您安排換貨,並附上回郵讓您免費寄回。能否麻煩您拍一張瑕疵照片給我們,我們會優先處理,盡快讓您收到完好的商品。
---
客戶訊息:你們的東西真的很好用,謝謝!
回覆:看到您這樣說,我們整個團隊都好開心~非常謝謝您的支持與肯定!如果之後使用上有任何想法或建議,都歡迎告訴我們,我們會繼續努力做得更好。
---
客戶訊息:(在這裡貼上這次要回覆的真實客戶訊息)
回覆:
如果這組「角色+語氣原則」是每次都固定要用的,更穩的做法是把它抽出來放進 System Prompt 當常駐設定,使用者訊息只放當次的範例與待辦輸入,這樣多輪對話下來語氣不會走鐘。
對應的文字版 Workflow 流程圖如下,可以接進你的自動化流程裡:
客戶來訊
↓
判斷是否屬於可自動回覆類型(查詢/抱怨/稱讚)
↓
依類型,從範例庫動態抽出最相關的 3 組範例
↓
套用 Few-shot 模板(指令 + 動態 3 組範例 + 本次訊息)
↓
模型產出回覆草稿
↓
信心檢核:是否含敏感詞/金額/退款承諾?
├─ 否 → 直接送出或排入待發
└─ 是 → 轉真人客服審核後再送
↓
記錄此次問答 → 定期挑出好回覆,回補成新範例
注意最後一步:把表現好的真實問答回補成新範例,等於讓你的 Few-shot 模板會隨時間越養越準。想要更多現成可套的範本,可以到 任務食譜書 找對應情境的版本,或直接用 提示詞產生器 產一版含範例的起手式再微調。
進階:更深入的一層——讓範例自己「動起來」
學會了基本五步,多數人會卡在一個瓶頸:範例放固定的那幾組,遇到沒見過的情境就開始飄。 你想多塞一點範例涵蓋更多狀況,又怕 token 爆掉、焦點被稀釋。這一節談三個進階手法,幫你突破這個天花板。
一、動態範例檢索(Dynamic Few-shot Retrieval)
這是進階做法的核心。與其每次都塞同一組固定範例,不如**根據這次的輸入,從範例庫裡即時挑出「最相關的 2~3 個」**再組進 Prompt。詢問出貨就抽出貨類範例,客訴抱怨就抽抱怨類範例。
做法有兩種層次。輕量版:用規則分類(關鍵字、意圖判斷)把輸入分到某一類,再從該類抽範例。進階版:把範例庫向量化,用語意相似度檢索出最接近當前輸入的範例——這其實就是 RAG 的精神套在範例挑選上。動態檢索的好處很實際:命中率更高、token 更省、涵蓋面更廣,因為你的範例庫可以養到上百組,但每次只挑最對的幾個進場。
| 固定 Few-shot | 動態檢索 Few-shot | |
|---|---|---|
| 範例怎麼選 | 每次都放同一組 | 依當次輸入即時挑相關的 |
| 範例庫規模 | 受 token 限制,通常 3~5 組 | 可養到數十、上百組 |
| 涵蓋面 | 窄,沒見過的情境易翻車 | 廣,總能找到最接近的示範 |
| 維護成本 | 低,但容易過時 | 較高,需要分類或向量索引 |
| 適合誰 | 情境單純的個人或小團隊 | 情境多樣、量大的正式產線 |
二、Few-shot+思維鏈:連「怎麼想」一起教
純風格模仿不需要推理,但只要任務帶判斷成分——例如「把客訴依嚴重程度分成高/中/低」「幫履歷打分數」——光給「輸入→輸出」就不夠了,模型不知道你是「憑什麼」這樣判。
解法是在每個範例裡多示範一段簡短推理,把它升級成 Few-shot 加上 思維鏈(Chain-of-Thought):
客訴內容:商品晚了兩天到,但東西完好。
判斷理由:有延遲但無實質損失,客戶語氣平和 → 屬輕微。
嚴重程度:低
客訴內容:付款成功但訂單消失,客戶已等三天無人回應。
判斷理由:涉及金流疑慮且久候無回應 → 信任受損,需優先處理。
嚴重程度:高
模型看了會學到的不只是「答案長怎樣」,而是「你判斷的依據」。實務上這能明顯拉高判斷一致性,因為你把隱性的評分標準,變成了模型看得到的示範。
三、用元提示批量養範例庫
範例庫要養大,純靠人工寫太慢。進階團隊的做法是把 Meta Prompting 接進流程:先請 AI 依某情境生成一批候選範例,再走一道人工篩選關卡,留下達標的入庫。整套思路其實和 Prompt 串接 很像——把「生成範例→人工把關→入庫→上線測試」串成一條會自我增強的管線。記住那條鐵律:AI 可以幫你生草稿,但定稿的品質關,必須由人把守,因為範例就是輸出的天花板。
常見錯誤:這幾個地雷會讓 Few-shot 失效
- 範例品質參差:用了幾個自己其實也不太滿意的範例,模型只會學到平庸。範例是天花板,務必精挑。
- 格式不一致:三組範例用了三種標籤或分隔方式,模型抓不到該模仿哪個結構,輸出就會亂。
- 範例和待辦輸入沒隔開:模型分不清哪段是示範、哪段是任務,可能把範例內容也當成要回答的東西。
- 範例太多太雜:塞了十幾個雷同範例,不但吃 token,還稀釋焦點,效果反而比三個精選範例差。
- 範例涵蓋面太窄:全部都是同一種情境的範例,一遇到沒見過的狀況就翻車,記得讓範例帶點變化,或改用上面講的動態檢索。
- 範例藏了偏誤:例如三個範例剛好都是長回覆,模型就以為「一定要寫很長」;範例裡的隱性偏好,模型會照單全收,挑範例時要留意。
- 該用結構規則卻只靠範例:需要嚴格機器可解析格式時,光靠範例示範不夠保險,要搭 結構化輸出 的明確規則一起守。
最佳實務:讓 Few-shot 又準又省的幾個技巧
第一,範例先 in-house 養一批。把公司裡公認寫得好的真實案例整理成一個範例庫,依情境分類,要用時直接抽。這比每次臨時編範例又快又穩。
第二,動態挑範例,而非全部塞進去。進階做法是根據這次的輸入類型,從範例庫裡挑「最相關的 2~3 個」放進 Prompt,而不是固定塞同一組。詢問出貨就放出貨類範例,抱怨就放抱怨類範例,這樣命中率最高、也最省 token。
第三,把規則和範例搭配用。Few-shot 不是要你完全不寫規則,而是「能用範例示範的就示範,講得清楚的硬規則(例如『金額一律不要在訊息裡承諾』)就明寫」。範例負責風格,規則負責紅線,兩者互補最穩。配合 System Prompt 把紅線規則設成常駐,效果更扎實。
第四,範例放在指令之後、輸入之前。這個位置順序對多數模型最友善:先讓模型知道任務目標,再看示範,最後接到真正要處理的輸入,符合人類「先理解、再看範例、再動手」的認知節奏。Few-shot 也能和 Prompt 串接 合用,在串接的某一段嵌入範例,讓那一步更精準。
實際案例:台灣電商客服導入 Few-shot 的前後對比
以下是一個整理自台灣中小型電商常見情境的案例。某家經營保養品的網路品牌,每天透過官方 LINE 和社群收到約 200 則客戶訊息,原本由兩位客服人員手動回覆。
導入前的痛點:兩位客服人手寫回覆,尖峰時段回不完,平均首次回覆時間長達 35 分鐘;更麻煩的是兩人語氣不一致,有人偏制式、有人偏隨性,客戶體驗忽冷忽熱。團隊曾試過用 Zero-shot 方式叫 AI 幫忙草擬,但跑出來的回覆「太官腔像罐頭」,客服得大改才能用,等於沒省到力。
導入做法:團隊先從過去三個月的對話紀錄裡,挑出 18 則客服主管公認「最得體」的真實問答,依「查詢、抱怨、退換貨、稱讚」四類各選範例,建成一個小範例庫。再用本文的 Few-shot 模板,依每則來訊的類型動態抽 3 個對應範例組成 Prompt,產出回覆草稿,含金額或退款承諾的才轉真人審核。
導入後的成果數據(導入 6 週後與導入前一個月相比):
- 平均首次回覆時間從 35 分鐘降到約 6 分鐘,縮短約 83%。
- 可直接送出、不需修改的回覆草稿比例,從 Zero-shot 時期的不到 2 成,提升到約 7 成。
- 客服每日手動撰寫的訊息量減少約 6 成,兩位客服得以把時間挪去處理真正棘手的客訴。
- 客戶滿意度問卷中「回覆語氣得體」一項,正面評價從導入前的 71% 提升到 89%。
關鍵轉折就在那 18 則精選範例——團隊沒有去寫一份洋洋灑灑的「客服語氣規範」,而是直接拿真實的好回覆當範例,讓 AI 模仿。這正是 Few-shot 的威力:把「講不清楚的風格」變成「看得到的示範」。
第二個案例:台灣內容團隊用 Few-shot 統一專欄調性
再看一個內容產製的情境。某個經營理財知識的台灣自媒體團隊,有四位約聘寫手協作同一個專欄,長期苦於「每個人筆調差太多」——有人愛掉書袋、有人太口語,導致整個品牌的聲音不一致,主編每篇都要重抓語感、改到深夜。
他們的做法是:把過去點閱與留言反應最好的 5 篇文章,各抽出「開頭鉤子段」「重點條列段」「結尾行動呼籲段」三種片段,整理成一份分段範例庫。寫手動筆前,先用 Few-shot 餵 AI 產一版符合品牌調性的草稿骨架,寫手再在骨架上補血肉。
成果是:新進寫手的稿件「需要主編大改」的比例,從導入前約 6 成降到約 2 成;主編花在「對齊調性」的時間,每篇從平均 40 分鐘降到約 12 分鐘。團隊的心得很直白——與其寫一份沒人會認真看的「品牌語氣手冊」,不如把手冊變成五篇看得到的範例。 想把這套流程接成可重複的自動化,可以參考 Prompt 串接 把「產骨架→寫手補寫→AI 校稿」串起來。
上述兩個案例的數據為情境化示意,實際成效會因產業、範例品質與商品特性而異,導入前建議先小規模試跑驗證,再逐步擴大。
結論:當你描述不清楚時,就用範例教
回到最開頭那個困擾:為什麼描述一堆規則,AI 還是抓不到你的風格?因為風格本來就難用文字精準傳達,但很容易用範例展示。 Few-shot 提示的精髓,就是承認「有些東西只能意會」,然後乾脆把那個「意會」具體化成幾個看得見的範例,讓模型照著模仿。
實作上記住這條主線:確認任務適合用範例 → 精挑 2 到 5 個高品質範例 → 統一格式與標籤 → 按結構組裝 → 用新輸入測試並汰換。 範例品質是天花板,格式一致是地基,動態挑選與「Few-shot+思維鏈」則是把你推上進階的兩塊跳板。把這套練熟,你會發現很多原本「怎麼描述都不對味」的任務,丟幾個範例就解決了。
下一步往哪走?如果你的任務帶判斷或推理,接著把 思維鏈(Chain-of-Thought) 疊上去,讓模型連「怎麼想」一起學;如果你要把 Few-shot 接進多步驟自動化,就用 Prompt 串接 把整條流程編排起來;如果你想要的是穩定可解析的輸出格式,結構化輸出提示 會是你的下一塊拼圖。想直接拿可套用的提示詞,任務食譜書 有大量分類好的範本;有導入上的具體問題,也歡迎透過 聯絡我們 與 AgentAI 智庫團隊討論。
❓ 常見問題 FAQ
Few-shot 和 Zero-shot 提示有什麼不同?
到底要給幾個範例才夠?
Few-shot 的範例可以隨便從網路抄嗎?
Few-shot 和 <a href='/guides/prompt-chaining'>Prompt Chaining</a> 是同一件事嗎?
為什麼我給了範例,AI 還是不照格式做?
Few-shot 範例該放在 System Prompt 還是使用者訊息裡?
範例要附「為什麼這樣回」的推理過程嗎?
範例自己寫太累,有沒有更快的辦法?
🔗 延伸閱讀
- ChatGPT 提示詞完整指南:從入門到進階
- Prompt 工程框架大全:5 種框架寫出穩定指令
- Prompt 串接(Chaining):把複雜任務拆成多段提示
- 結構化輸出:讓 AI 穩定吐出可解析的格式
- 思維鏈(Chain-of-Thought):讓 AI 一步一步想
每週把這類實戰教學寄給你
訂閱 AgentAI 智庫情報週報,新的 Prompt、AI Skills、工作流與教學第一時間收到。
免費 · 隨時取消