寫 Prompt 遇到複雜任務時,大多數人的直覺是「把要求寫得更詳細、更長」,結果指令越塞越多,模型卻越來越常漏掉中間幾項、輸出時好時壞。這篇文章要教你另一條路——Prompt 串接(Chaining):把一個大任務拆成幾段各自只做一件事的提示,讓前一段的輸出餵進下一段,逐段把品質鎖死。 適合已經會寫 Prompt、但一碰到多步驟任務就失控的工作者,以及準備把 AI 放進正式流程的團隊。讀完你會得到可直接複製的串接 Prompt 模板、四種常見串接模式,以及判斷「哪些任務該拆、怎麼拆」的方法。
如果你還在打基礎,建議先看完 ChatGPT 提示詞攻略 與 Prompt 工程框架大全,確定單一 Prompt 已經寫得夠穩,再回來學「把多個穩定 Prompt 接成一條可靠的鏈」這門進階功夫。
為什麼複雜任務不能用一個大 Prompt 解決?
先講一個很多人都踩過的坑。假設你要 AI 做一件事:「讀一篇 3000 字的訪談逐字稿,抓出重點、判斷情緒、寫成一則 100 字社群貼文、再給三個標題。」你把這四項要求全部塞進一個 Prompt,跑出來的結果通常是——重點抓得馬虎、情緒判斷被忽略、貼文倒是寫了、標題剩兩個。
這不是模型笨,而是單一 Prompt 的注意力會被稀釋。當一段指令同時要求模型「理解、判斷、創作、發想」四種不同性質的工作,它很難每一項都全力以赴,越後面的要求越容易被犧牲。這跟你叫一個人「一邊聽電話、一邊算帳、一邊寫文案」是一樣的道理。
硬把 Prompt 寫長還會帶來三個副作用。第一是難除錯:結果不好,你根本不知道是哪一項要求出了問題,只能整段重寫。第二是難維護:十項要求糾纏在一段文字裡,改 A 常常不小心動到 B。第三是難規模化:這種巨無霸 Prompt 沒辦法被乾淨地接進自動化 Workflow,因為它的中間產物全藏在模型腦袋裡,外部程式拿不到。
還有一個比較隱形、但很致命的副作用:錯誤無法被攔截。在一個大 Prompt 裡,模型如果第一步「抓重點」就抓歪了,它會帶著歪掉的重點繼續寫貼文、繼續想標題,而你完全看不到中間發生了什麼。等成品出來你才發現不對,卻已經無從得知是哪一環先壞的。Prompt 串接要解決的,就是把「一口氣做完」改成「分段完成、逐段驗收」,讓每一個環節都攤在陽光下。
核心概念:什麼是 Prompt 串接?
Prompt 串接(Prompt Chaining)的定義很簡單:把一個複雜任務拆成多個子任務,每個子任務用獨立的 Prompt 處理,並把前一段的輸出當作後一段的輸入,串成一條有順序的鏈條。
最好的比喻是工廠的生產線。一個複雜產品不會由一個師傅從頭做到尾,而是拆成數個工站:第一站只負責裁切、第二站只負責組裝、第三站只負責品檢。每一站專注一件事、做完交給下一站,且每一站都能單獨檢查良率。Prompt 串接就是把 AI 任務變成這樣一條生產線——每一段提示是一個工站。
要注意,串接處理的是「不同性質、要分站做」的任務切分;它和 思維鏈(Chain of Thought) 是兩個層次的事。思維鏈是在同一段 Prompt 裡,要求模型把推理步驟「想出來、寫出來」以提高單站準確度;串接則是把不同段 Prompt 接起來。實務上兩者常一起用:在「需要判斷」的那一站內部用思維鏈讓它想清楚,再把結論用結構化格式交給下一站。
下面這張表把「單一大 Prompt」和「串接」的差別講清楚:
| 比較項目 | 單一大 Prompt | Prompt 串接 |
|---|---|---|
| 注意力 | 同時扛多種任務,容易顧此失彼 | 每段只專注一件事,品質集中 |
| 除錯 | 出錯不知問題在哪,只能整段重來 | 哪一段壞了一目了然,單獨改 |
| 中間產物 | 藏在模型腦中,外部拿不到 | 每段輸出都看得見、可驗證 |
| 串接系統 | 難接進自動化流程 | 天生適合接成 Workflow |
| 成本控制 | 一次失敗整段重跑,浪費大 | 只重跑壞掉那一段,浪費小 |
| 適合場景 | 簡單、單一性質的任務 | 多步驟、跨性質的複雜任務 |
要特別釐清一個常見誤會:Prompt 串接不等於多 Agent 系統。串接是你預先設計好固定路線的多段提示,AI 只負責執行每一站,不自己決定要走哪條路;多 Agent 協作 則能讓多個 AI 根據情況自主決定下一步、彼此分工。串接是邁向 Agent 的基礎能力,先把固定鏈條練穩,再談讓 AI 自主決策才有意義。
實際教學:五步驟拆出一條穩定的鏈
我們用一個真實任務貫穿全部步驟:把一篇客戶訪談逐字稿,加工成一則社群貼文與三個標題。這是台灣內容、行銷團隊每天都在做的事。
Step 1:拆解任務節點
先別碰 Prompt,先拿張紙把任務拆成「各自只做一件事」的節點。上面的任務可以拆成四站:
- 萃取:從逐字稿抓出 5 個重點與整體情緒。
- 定調:根據重點與情緒,決定貼文要走的角度與語氣。
- 撰寫:寫出一則 100 字貼文。
- 發想:根據貼文產出三個標題。
判斷該不該拆的原則:只要一個步驟同時包含「理解」「判斷」「創作」中的兩種以上,就該拆。 萃取是理解、定調是判斷、撰寫與發想是創作,性質都不同,所以拆開。
Step 2:設計每段的輸入輸出
為每一站明確定義「收到什麼、吐出什麼」。這一步是串接能不能對接的關鍵——上一站的輸出格式,必須剛好是下一站需要的輸入格式。
- 第一站:輸入「逐字稿」,輸出「重點清單 + 情緒標籤」。
- 第二站:輸入「重點清單 + 情緒標籤」,輸出「貼文角度 + 語氣指示」。
- 第三站:輸入「貼文角度 + 語氣指示 + 重點清單」,輸出「100 字貼文」。
- 第四站:輸入「100 字貼文」,輸出「三個標題」。
設計輸入輸出時,最容易被忽略的是「只傳下一站真正需要的欄位」。第三站不需要整份逐字稿,只需要重點與語氣;硬把 3000 字逐字稿一路傳到底,只會稀釋重點又燒 token。
Step 3:鎖定中繼格式
段與段之間,一律用 JSON 或固定欄位傳遞,不要用一段自然語言去餵下一段。自然語言模糊、容易讓下一段誤解;結構化格式讓下一段穩定解析,也方便你在中間插程式做驗證或過濾。這背後其實是一整套技巧,值得單獨花時間練——可參考 結構化輸出提示法 把「逼模型只吐乾淨 JSON」這件事做到滴水不漏。
例如第一站的輸出固定成這樣:
{
"points": ["重點一", "重點二", "重點三", "重點四", "重點五"],
"emotion": "正面 / 中性 / 負面",
"quote": "最有代表性的一句客戶原話"
}
第二站就能穩穩地讀到 points、emotion、quote 三個欄位,不會猜錯。如果某些站的輸出格式很挑、模型常出錯,可以在該站的 Prompt 裡放一兩個「輸入長這樣、輸出就該長這樣」的範例,也就是 Few-shot 範例提示法,用示範把格式釘死,比純文字說明更可靠。
Step 4:串接並傳遞變數
把前一段輸出當變數,用 {{變數}} 的方式塞進下一段 Prompt,逐段執行。手動操作時就是「複製上一段的 JSON、貼進下一段的指定位置」;自動化時則由程式或 Workflow 工具自動傳遞。重點是每一段 Prompt 都明寫「你會收到 {{上一段輸出}},請只根據它作答」,避免模型自由發揮。
另外建議替每一站都配一個專屬角色的 System Prompt,例如第一站固定是「你是只負責萃取、不負責創作的資深企劃」。把角色寫進 System 層而非每次都塞在使用者訊息裡,能讓該站的行為更穩定、也更省事。
Step 5:加檢核與回退
串接最大的風險是錯誤會一路放大:第一站重點抓錯,後面三站全部跟著錯。所以要在關鍵節點加驗證——例如第一站輸出後,先用程式檢查「是不是剛好 5 個重點、emotion 是不是三個合法值之一」。不合格就回退重跑該段,或在難判斷時轉人工,把錯誤擋在傳下去之前。這是串接和「一次到底」最本質的差別。
範例:Prompt 與 Workflow
下面是可直接複製的四段串接 Prompt。每一段都標明了輸入變數與輸出格式。
【第一段:萃取】
你是資深內容企劃,只負責萃取,不負責創作。
輸入逐字稿:{{transcript}}
請輸出嚴格的 JSON,不要多餘文字:
{
"points": [5 個重點,每個 20 字內],
"emotion": "正面 或 中性 或 負面",
"quote": "最有代表性的一句客戶原話"
}
若資訊不足以湊滿 5 個重點,points 寧可少於 5 個也不要編造。
【第二段:定調】
你是社群編輯。收到上一段的萃取結果:{{stage1_json}}
請根據 points 與 emotion,輸出 JSON:
{
"angle": "這則貼文要切的角度,一句話",
"tone": "語氣,例如 溫暖 / 專業 / 活潑"
}
【第三段:撰寫】
你是社群文案。收到角度與語氣:{{stage2_json}},以及重點:{{stage1_points}}
請寫一則繁體中文(台灣用語)貼文,限 100 字內,語氣依 tone。
只輸出貼文本文,不要解釋。
【第四段:發想標題】
你是標題編輯。收到貼文:{{stage3_text}}
請輸出 3 個吸睛標題,每個 15 字內,風格各不同(疑問式 / 數據式 / 情緒式)。
以 JSON 陣列輸出。
文字版 Workflow 流程圖如下:
逐字稿輸入
↓
[第一段:萃取] → 輸出 重點清單 + 情緒 (JSON)
↓
[驗證] 是否剛好 5 個重點、emotion 合法?
↓ 否 → 回退重跑第一段 / 轉人工
↓ 是
[第二段:定調] → 輸出 角度 + 語氣 (JSON)
↓
[第三段:撰寫] → 輸出 100 字貼文
↓
[驗證] 字數是否 ≤ 100、語氣是否符合?
↓ 否 → 回退重跑第三段
↓ 是
[第四段:發想] → 輸出 3 個標題
↓
完稿輸出(貼文 + 標題)
每一段 Prompt 都不必從零手寫。你可以用 Prompt 產生器 先生出每一站的初稿,再依本文的輸入輸出規格微調對接欄位,能省下大量打字時間。想找更多可直接套用的串接模板,也可以參考 Prompt 資料庫。
四種常見串接模式
串接不只有「一條線走到底」這一種。實務上有四種模式,可以混搭:
- 線性串接(Sequential):A → B → C,最基本,上面的範例就是。適合有明確先後順序的任務。
- 分支串接(Branching):某段輸出後依結果走不同分支。例如情緒判為「負面」就走安撫話術鏈,「正面」就走推薦話術鏈。
- 平行串接(Parallel):把一份輸入同時餵給多段獨立 Prompt,再彙整。例如同一份逐字稿,一段抓重點、一段抓金句、一段抓待辦,最後合併。
- 迴圈串接(Loop):同一段反覆執行直到符合條件。例如「寫貼文 → 自我檢查字數 → 超字就重寫」,循環到過關為止。
掌握這四種模式後,你就能組合出相當複雜的流程,這也是邁向 多 Agent 協作 的前置基礎。
進階:更深入的一層
學會把鏈接起來之後,真正讓串接「上得了正式流程」的,是底下這幾層多數教學不會講的眉角。
第一,用「評審站」取代讓模型自我檢查。 很多人會在最後一站叫模型「請檢查上面寫得好不好」,但同一個模型既當運動員又當裁判,往往會自我感覺良好。更穩的做法是新增一個獨立的評審站(Critique Stage),給它一份明確的評分規格(例如:是否扣題、字數是否達標、有無中國慣用詞),讓它對前一站的輸出打分並指出問題;分數不過就回退重寫。要把評審規格寫得乾淨、可重用,可以用 Meta Prompting(讓 AI 幫你寫 Prompt) 先請模型替你產出一份嚴謹的評分準則,再固定成這一站的 System Prompt。
第二,分清「硬規則」和「軟判斷」,用不同方式驗證。 字數、欄位齊不齊、列舉值合不合法——這些是硬規則,務必用程式檢查,模型自評不可靠。語氣對不對、有沒有抓到客戶真正在意的點——這些是軟判斷,才交給評審站處理。把兩者混在一起,會讓你既擋不住低級錯誤、又浪費模型算力。
下面這張表幫你把「進階機制」對應到「適用情境」:
| 進階機制 | 解決什麼問題 | 什麼時候用 |
|---|---|---|
| 評審站(Critique) | 模型自評不客觀、品質飄忽 | 對外發布、品質要求高的鏈 |
| 程式硬驗證 | 字數、欄位、列舉值出錯 | 任何要接進自動化的鏈 |
| 迴圈重寫(Loop) | 一次寫不到位、需逐步逼近 | 字數/格式/風格要反覆收斂時 |
| 分支路由(Branching) | 不同輸入要走不同處理 | 客服分流、情緒分流等 |
| 中繼資料落地 | 出錯難回溯、無法追責 | 規模化、要稽核的正式流程 |
第三,把中繼產物落地保存。 在玩具階段,中間 JSON 用複製貼上就好;但要規模化時,請把每一站的輸入與輸出都寫進資料庫或日誌。這樣一旦某天成品出包,你能精準回放「是哪一站、收到什麼、吐出什麼」,這是串接相對單一大 Prompt 最值錢的稽核能力,別在工程上把它浪費掉。當某一站需要即時讀外部資料(CRM、商品庫存、知識庫)時,也是在這一層把資料源接進來,再把結果用結構化格式往下傳。
第四,控制脈絡長度(context)。 鏈越長,越要警惕「每一站都把前面全部歷史貼進去」。正確做法是只傳下一站需要的最小欄位:第四站想標題時,它只需要第三站的貼文本文,根本不需要第一站的逐字稿。脈絡傳得精準,不只省 token,也讓每一站的注意力更集中、品質更穩。
常見錯誤
- 拆太細:把每個動詞都拆成一段,鏈條過長反而拖慢又增加成本。原則是「按任務性質拆」,不是「按句子拆」。
- 段間用自然語言傳遞:上一段吐一大段文字餵下一段,下一段常誤解。一定要用 JSON 或固定欄位。
- 不設驗證就串:以為每段都會乖乖照規格輸出,結果一段壞全鏈壞。關鍵節點務必加檢核與回退。
- 每段都重貼整份原始資料:在每一段都把 3000 字逐字稿再貼一次,浪費 token 又稀釋重點。只傳下一段真正需要的欄位。
- 沒鎖輸出格式:第一段沒要求純 JSON,模型多嘴加了「好的,以下是結果」,下一段解析就爆掉。明寫「只輸出 JSON,不要任何多餘文字」。
- 讓同一個模型既寫又評:自我檢查容易自我感覺良好,硬規則該交給程式、軟判斷該交給獨立評審站。
最佳實務
把以下幾點變成你串接的預設習慣:
- 先畫流程圖再寫 Prompt:節點、資料流向、驗證點先在紙上定清楚,再動手寫,能少改很多次。
- 每段都加一句「只根據上一段輸出作答」:收束模型的自由發揮,是串接穩定的便宜大補帖。
- 把驗證做成程式而非靠模型自評:字數、欄位、合法值這種硬規則,用程式檢查比叫模型自己檢查可靠得多。
- 保留每段的中間產物:出問題時可以快速定位是哪一站壞了,這正是串接相對單一大 Prompt 的最大優勢,別浪費掉。
- 先手動跑通再自動化:用複製貼上把整條鏈手動跑順、確認品質穩定後,再接進 Workflow 工具自動化。
- 替每一站立 System Prompt:把角色與禁區寫進 System Prompt,讓每站行為更收斂、更可重複。
實際案例一:台灣電商客服與內容團隊
情境:一家台灣中型電商的內容團隊,每週要把約 20 場客戶訪談錄音整理成社群素材。原本他們用一個塞滿要求的長 Prompt 一次處理,結果品質很不穩。
導入前:每篇成品平均要人工大改 2 次才能用,重點常抓錯、標題常只生出一兩個;一週 20 篇要花約 18 小時,且編輯抱怨「不知道 AI 哪裡會出包,每次都要從頭檢查」。
導入後:團隊把流程拆成上面那條四段串接鏈,並在第一段「萃取」後加了程式驗證(檢查重點數量與情緒值合法性),不合格自動回退重跑。同時改成只在第一段傳完整逐字稿,後面各段只傳必要欄位。
成果數據(團隊內部三個月統計,數字為該團隊實測,僅供參考):
- 平均人工修改次數從 2 次降到 0.4 次,一次到位率約八成。
- 單週處理時間從約 18 小時降到約 7 小時,省下約六成工時。
- 因為中間產物看得見,編輯遇到問題能直接指出「是第一段萃取漏了」,除錯時間大幅縮短,新人也更容易上手。
關鍵轉變不在於用了多厲害的模型,而在於把任務拆對、把節點驗好。這正是 Prompt 串接最務實的價值。
實際案例二:在地電商客服的分支與評審鏈
情境:同一家電商,後來把串接用到了客服回覆草稿。客戶問題從 LINE 官方帳號進來,五花八門:有人問退貨、有人罵到飆髒話、有人只是想加購。一條線走到底顯然不夠,他們改用分支 + 評審的混合鏈。
做法:第一站先做「分流」,把訊息分類成「客訴/一般詢問/加購意圖」三類並輸出情緒分數;分類後走不同分支——客訴走安撫話術鏈、加購走推薦話術鏈。每條分支的最後都接一個獨立評審站,依固定規格檢查草稿「有沒有承諾做不到的事、語氣會不會火上加油、有無中國用語」,不過就回退重寫,過了才送給真人客服按下發送。
成果數據(團隊內部統計,僅供參考):
- 客服首封回覆的草稿可用率從約五成提升到約九成,真人只需微調。
- 因分流精準,負面情緒客訴的平均首回時間從 12 分鐘縮短到約 4 分鐘。
- 評審站擋下的問題裡,「擅自承諾退款時程」這類風險回覆占了三成,等於提前攔住了潛在客訴升級。
這個案例的重點是:當任務本身會「因輸入而分歧」,就不要硬塞進一條線,用分支把路徑攤開、用評審站把品質收口,才是串接該有的樣子。
免責聲明
本文所引用的數據皆為文中虛構團隊的內部實測情境,僅供說明串接效益之用,不代表你導入後必能複製相同結果。實際成效會因任務性質、所用模型、資料品質與驗證設計而有很大差異,請以你自己環境的小規模試跑結果為準。
結論
複雜任務做不穩,問題往往不是 Prompt 寫得不夠長,而是你想用「一站」做完該由「一條生產線」完成的事。Prompt 串接的核心心法只有三句:拆成各做一件事的節點、用結構化格式對接、在關鍵點加驗證與回退。 把這三件事做到位,再加上獨立評審站與中繼產物落地,你的 AI 輸出就能從「碰運氣」變成「每次都穩、看得見、改得動、能上線」。
下一步,建議你先挑一個目前最讓你頭痛的多步驟任務,照本文五步驟把它拆成一條鏈,手動跑通後再考慮自動化。要把每一站的輸出鎖死,先精讀 結構化輸出提示法;想把鏈條進化成能自主分工的系統,接著看 多 Agent 協作;若你連單站 Prompt 都還想再打磨,回頭把 Prompt 工程框架 練到滾瓜爛熟,整條鏈自然更穩。
❓ 常見問題 FAQ
Prompt Chaining 和把指令寫長一點有什麼不同?
串接會不會讓成本變高、速度變慢?
段與段之間該用什麼格式傳資料?
Prompt Chaining 和 AI Agent 是同一件事嗎?
中間某一段出錯,整條鏈會不會跟著壞掉?
每一段 Prompt 要不要都寫 System Prompt?
怎麼決定一個任務該拆成幾段?
串接的每一段 Prompt 寫不出來怎麼辦?
🔗 延伸閱讀
- Prompt 工程框架大全:5 種框架寫出穩定指令
- 結構化輸出:讓 AI 穩定吐出 JSON 與固定格式
- 多 Agent 協作:讓多個 AI 分工合作
- 思維鏈(Chain of Thought):讓 AI 一步步想清楚
- System Prompt 完整指南:替每個 AI 角色立規矩
每週把這類實戰教學寄給你
訂閱 AgentAI 智庫情報週報,新的 Prompt、AI Skills、工作流與教學第一時間收到。
免費 · 隨時取消