Prompt Chaining 串接完整教學：拆任務換穩定產出

Q: Prompt Chaining 和把指令寫長一點有什麼不同？

差在 可控性 。一個塞滿十項要求的長 Prompt，模型很容易顧此失彼、漏掉中間幾項；串接是把十項拆成幾段、每段只專注一件事，前段輸出驗證過再進下一段，所以每一步都看得到、改得動、測得了。

Q: 串接會不會讓成本變高、速度變慢？

會多花 token 和時間，因為呼叫了多次模型。但對複雜任務來說，串接換來的是 更高的一次成功率 ，反而減少了「整段重來」的浪費。簡單任務不必串，複雜或要上線的任務才值得拆。

Q: 段與段之間該用什麼格式傳資料？

盡量用 JSON 或固定欄位 ，不要用一段自然語言去餵下一段。結構化格式讓下一段能穩定解析、也方便你在中間插入程式做驗證或過濾，這是串接穩定的關鍵，建議搭配 結構化輸出 的技巧把每段輸出鎖死。

Q: Prompt Chaining 和 AI Agent 是同一件事嗎？

不是，但有關係。串接是 固定路線 的多段提示，路徑由你預先設計好； 多 Agent 協作 則能讓多個 AI 自己決定下一步走哪。串接是 Agent 的基礎能力之一，先把固定鏈條練穩，再談讓 AI 自主決策。

Q: 中間某一段出錯，整條鏈會不會跟著壞掉？

如果沒設檢核就會，錯誤會一路被放大。正確做法是在關鍵節點加 驗證與回退 ：輸出不符規格就重跑該段或轉人工，把錯誤擋在傳遞下去之前，這是串接和「一次到底」最大的差別。

Q: 每一段 Prompt 要不要都寫 System Prompt？

建議要。每一站給它一個專屬角色的 System Prompt （例如「你只負責萃取，不負責創作」），能大幅收束模型在該站的行為範圍，是讓每段穩定的便宜手段。

Q: 怎麼決定一個任務該拆成幾段？

用「任務性質」當切點，而不是「句子數量」。只要一個步驟同時包含 理解、判斷、創作 中的兩種以上就該拆；反之，性質相同、能一口氣做完的就別硬拆，鏈條太長反而拖慢又增加成本。

Q: 串接的每一段 Prompt 寫不出來怎麼辦？

可以先用 Prompt 框架 把單段寫穩，再用 Prompt 產生器 快速生出每一站的初稿，最後手動微調對接格式。先求每一站單獨會動，再談串起來。

寫 Prompt 遇到複雜任務時，大多數人的直覺是「把要求寫得更詳細、更長」，結果指令越塞越多，模型卻越來越常漏掉中間幾項、輸出時好時壞。這篇文章要教你另一條路——Prompt 串接（Chaining）：把一個大任務拆成幾段各自只做一件事的提示，讓前一段的輸出餵進下一段，逐段把品質鎖死。 適合已經會寫 Prompt、但一碰到多步驟任務就失控的工作者，以及準備把 AI 放進正式流程的團隊。讀完你會得到可直接複製的串接 Prompt 模板、四種常見串接模式，以及判斷「哪些任務該拆、怎麼拆」的方法。

如果你還在打基礎，建議先看完 ChatGPT 提示詞攻略與 Prompt 工程框架大全，確定單一 Prompt 已經寫得夠穩，再回來學「把多個穩定 Prompt 接成一條可靠的鏈」這門進階功夫。

為什麼複雜任務不能用一個大 Prompt 解決？

先講一個很多人都踩過的坑。假設你要 AI 做一件事：「讀一篇 3000 字的訪談逐字稿，抓出重點、判斷情緒、寫成一則 100 字社群貼文、再給三個標題。」你把這四項要求全部塞進一個 Prompt，跑出來的結果通常是——重點抓得馬虎、情緒判斷被忽略、貼文倒是寫了、標題剩兩個。

這不是模型笨，而是單一 Prompt 的注意力會被稀釋。當一段指令同時要求模型「理解、判斷、創作、發想」四種不同性質的工作，它很難每一項都全力以赴，越後面的要求越容易被犧牲。這跟你叫一個人「一邊聽電話、一邊算帳、一邊寫文案」是一樣的道理。

硬把 Prompt 寫長還會帶來三個副作用。第一是難除錯：結果不好，你根本不知道是哪一項要求出了問題，只能整段重寫。第二是難維護：十項要求糾纏在一段文字裡，改 A 常常不小心動到 B。第三是難規模化：這種巨無霸 Prompt 沒辦法被乾淨地接進自動化 Workflow，因為它的中間產物全藏在模型腦袋裡，外部程式拿不到。

還有一個比較隱形、但很致命的副作用：錯誤無法被攔截。在一個大 Prompt 裡，模型如果第一步「抓重點」就抓歪了，它會帶著歪掉的重點繼續寫貼文、繼續想標題，而你完全看不到中間發生了什麼。等成品出來你才發現不對，卻已經無從得知是哪一環先壞的。Prompt 串接要解決的，就是把「一口氣做完」改成「分段完成、逐段驗收」，讓每一個環節都攤在陽光下。

核心概念：什麼是 Prompt 串接？

Prompt 串接（Prompt Chaining）的定義很簡單：把一個複雜任務拆成多個子任務，每個子任務用獨立的 Prompt 處理，並把前一段的輸出當作後一段的輸入，串成一條有順序的鏈條。

最好的比喻是工廠的生產線。一個複雜產品不會由一個師傅從頭做到尾，而是拆成數個工站：第一站只負責裁切、第二站只負責組裝、第三站只負責品檢。每一站專注一件事、做完交給下一站，且每一站都能單獨檢查良率。Prompt 串接就是把 AI 任務變成這樣一條生產線——每一段提示是一個工站。

要注意，串接處理的是「不同性質、要分站做」的任務切分；它和思維鏈（Chain of Thought）是兩個層次的事。思維鏈是在同一段 Prompt 裡，要求模型把推理步驟「想出來、寫出來」以提高單站準確度；串接則是把不同段 Prompt 接起來。實務上兩者常一起用：在「需要判斷」的那一站內部用思維鏈讓它想清楚，再把結論用結構化格式交給下一站。

下面這張表把「單一大 Prompt」和「串接」的差別講清楚：

比較項目	單一大 Prompt	Prompt 串接
注意力	同時扛多種任務，容易顧此失彼	每段只專注一件事，品質集中
除錯	出錯不知問題在哪，只能整段重來	哪一段壞了一目了然，單獨改
中間產物	藏在模型腦中，外部拿不到	每段輸出都看得見、可驗證
串接系統	難接進自動化流程	天生適合接成 Workflow
成本控制	一次失敗整段重跑，浪費大	只重跑壞掉那一段，浪費小
適合場景	簡單、單一性質的任務	多步驟、跨性質的複雜任務

要特別釐清一個常見誤會：Prompt 串接不等於多 Agent 系統。串接是你預先設計好固定路線的多段提示，AI 只負責執行每一站，不自己決定要走哪條路；多 Agent 協作則能讓多個 AI 根據情況自主決定下一步、彼此分工。串接是邁向 Agent 的基礎能力，先把固定鏈條練穩，再談讓 AI 自主決策才有意義。

實際教學：五步驟拆出一條穩定的鏈

我們用一個真實任務貫穿全部步驟：把一篇客戶訪談逐字稿，加工成一則社群貼文與三個標題。這是台灣內容、行銷團隊每天都在做的事。

Step 1：拆解任務節點

先別碰 Prompt，先拿張紙把任務拆成「各自只做一件事」的節點。上面的任務可以拆成四站：

萃取：從逐字稿抓出 5 個重點與整體情緒。
定調：根據重點與情緒，決定貼文要走的角度與語氣。
撰寫：寫出一則 100 字貼文。
發想：根據貼文產出三個標題。

判斷該不該拆的原則：只要一個步驟同時包含「理解」「判斷」「創作」中的兩種以上，就該拆。 萃取是理解、定調是判斷、撰寫與發想是創作，性質都不同，所以拆開。

Step 2：設計每段的輸入輸出

為每一站明確定義「收到什麼、吐出什麼」。這一步是串接能不能對接的關鍵——上一站的輸出格式，必須剛好是下一站需要的輸入格式。

第一站：輸入「逐字稿」，輸出「重點清單 + 情緒標籤」。
第二站：輸入「重點清單 + 情緒標籤」，輸出「貼文角度 + 語氣指示」。
第三站：輸入「貼文角度 + 語氣指示 + 重點清單」，輸出「100 字貼文」。
第四站：輸入「100 字貼文」，輸出「三個標題」。

設計輸入輸出時，最容易被忽略的是「只傳下一站真正需要的欄位」。第三站不需要整份逐字稿，只需要重點與語氣；硬把 3000 字逐字稿一路傳到底，只會稀釋重點又燒 token。

Step 3：鎖定中繼格式

段與段之間，一律用 JSON 或固定欄位傳遞，不要用一段自然語言去餵下一段。自然語言模糊、容易讓下一段誤解；結構化格式讓下一段穩定解析，也方便你在中間插程式做驗證或過濾。這背後其實是一整套技巧，值得單獨花時間練——可參考結構化輸出提示法把「逼模型只吐乾淨 JSON」這件事做到滴水不漏。

例如第一站的輸出固定成這樣：

{
  "points": ["重點一", "重點二", "重點三", "重點四", "重點五"],
  "emotion": "正面 / 中性 / 負面",
  "quote": "最有代表性的一句客戶原話"
}

第二站就能穩穩地讀到 points、emotion、quote 三個欄位，不會猜錯。如果某些站的輸出格式很挑、模型常出錯，可以在該站的 Prompt 裡放一兩個「輸入長這樣、輸出就該長這樣」的範例，也就是 Few-shot 範例提示法，用示範把格式釘死，比純文字說明更可靠。

Step 4：串接並傳遞變數

把前一段輸出當變數，用 {{變數}} 的方式塞進下一段 Prompt，逐段執行。手動操作時就是「複製上一段的 JSON、貼進下一段的指定位置」；自動化時則由程式或 Workflow 工具自動傳遞。重點是每一段 Prompt 都明寫「你會收到 {{上一段輸出}}，請只根據它作答」，避免模型自由發揮。

另外建議替每一站都配一個專屬角色的 System Prompt，例如第一站固定是「你是只負責萃取、不負責創作的資深企劃」。把角色寫進 System 層而非每次都塞在使用者訊息裡，能讓該站的行為更穩定、也更省事。

Step 5：加檢核與回退

串接最大的風險是錯誤會一路放大：第一站重點抓錯，後面三站全部跟著錯。所以要在關鍵節點加驗證——例如第一站輸出後，先用程式檢查「是不是剛好 5 個重點、emotion 是不是三個合法值之一」。不合格就回退重跑該段，或在難判斷時轉人工，把錯誤擋在傳下去之前。這是串接和「一次到底」最本質的差別。

範例：Prompt 與 Workflow

下面是可直接複製的四段串接 Prompt。每一段都標明了輸入變數與輸出格式。

【第一段：萃取】
你是資深內容企劃，只負責萃取，不負責創作。
輸入逐字稿：{{transcript}}
請輸出嚴格的 JSON，不要多餘文字：
{
  "points": [5 個重點，每個 20 字內],
  "emotion": "正面 或 中性 或 負面",
  "quote": "最有代表性的一句客戶原話"
}
若資訊不足以湊滿 5 個重點，points 寧可少於 5 個也不要編造。

【第二段：定調】
你是社群編輯。收到上一段的萃取結果：{{stage1_json}}
請根據 points 與 emotion，輸出 JSON：
{
  "angle": "這則貼文要切的角度，一句話",
  "tone": "語氣，例如 溫暖 / 專業 / 活潑"
}

【第三段：撰寫】
你是社群文案。收到角度與語氣：{{stage2_json}}，以及重點：{{stage1_points}}
請寫一則繁體中文（台灣用語）貼文，限 100 字內，語氣依 tone。
只輸出貼文本文，不要解釋。

【第四段：發想標題】
你是標題編輯。收到貼文：{{stage3_text}}
請輸出 3 個吸睛標題，每個 15 字內，風格各不同（疑問式 / 數據式 / 情緒式）。
以 JSON 陣列輸出。

文字版 Workflow 流程圖如下：

逐字稿輸入
   ↓
[第一段：萃取] → 輸出 重點清單 + 情緒 (JSON)
   ↓
[驗證] 是否剛好 5 個重點、emotion 合法？
   ↓ 否 → 回退重跑第一段 / 轉人工
   ↓ 是
[第二段：定調] → 輸出 角度 + 語氣 (JSON)
   ↓
[第三段：撰寫] → 輸出 100 字貼文
   ↓
[驗證] 字數是否 ≤ 100、語氣是否符合？
   ↓ 否 → 回退重跑第三段
   ↓ 是
[第四段：發想] → 輸出 3 個標題
   ↓
完稿輸出（貼文 + 標題）

每一段 Prompt 都不必從零手寫。你可以用 Prompt 產生器先生出每一站的初稿，再依本文的輸入輸出規格微調對接欄位，能省下大量打字時間。想找更多可直接套用的串接模板，也可以參考 Prompt 資料庫。

四種常見串接模式

串接不只有「一條線走到底」這一種。實務上有四種模式，可以混搭：

線性串接（Sequential）：A → B → C，最基本，上面的範例就是。適合有明確先後順序的任務。
分支串接（Branching）：某段輸出後依結果走不同分支。例如情緒判為「負面」就走安撫話術鏈，「正面」就走推薦話術鏈。
平行串接（Parallel）：把一份輸入同時餵給多段獨立 Prompt，再彙整。例如同一份逐字稿，一段抓重點、一段抓金句、一段抓待辦，最後合併。
迴圈串接（Loop）：同一段反覆執行直到符合條件。例如「寫貼文 → 自我檢查字數 → 超字就重寫」，循環到過關為止。

掌握這四種模式後，你就能組合出相當複雜的流程，這也是邁向多 Agent 協作的前置基礎。

進階：更深入的一層

學會把鏈接起來之後，真正讓串接「上得了正式流程」的，是底下這幾層多數教學不會講的眉角。

第一，用「評審站」取代讓模型自我檢查。 很多人會在最後一站叫模型「請檢查上面寫得好不好」，但同一個模型既當運動員又當裁判，往往會自我感覺良好。更穩的做法是新增一個獨立的評審站（Critique Stage），給它一份明確的評分規格（例如：是否扣題、字數是否達標、有無中國慣用詞），讓它對前一站的輸出打分並指出問題；分數不過就回退重寫。要把評審規格寫得乾淨、可重用，可以用 Meta Prompting（讓 AI 幫你寫 Prompt）先請模型替你產出一份嚴謹的評分準則，再固定成這一站的 System Prompt。

第二，分清「硬規則」和「軟判斷」，用不同方式驗證。 字數、欄位齊不齊、列舉值合不合法——這些是硬規則，務必用程式檢查，模型自評不可靠。語氣對不對、有沒有抓到客戶真正在意的點——這些是軟判斷，才交給評審站處理。把兩者混在一起，會讓你既擋不住低級錯誤、又浪費模型算力。

下面這張表幫你把「進階機制」對應到「適用情境」：

進階機制	解決什麼問題	什麼時候用
評審站（Critique）	模型自評不客觀、品質飄忽	對外發布、品質要求高的鏈
程式硬驗證	字數、欄位、列舉值出錯	任何要接進自動化的鏈
迴圈重寫（Loop）	一次寫不到位、需逐步逼近	字數/格式/風格要反覆收斂時
分支路由（Branching）	不同輸入要走不同處理	客服分流、情緒分流等
中繼資料落地	出錯難回溯、無法追責	規模化、要稽核的正式流程

第三，把中繼產物落地保存。 在玩具階段，中間 JSON 用複製貼上就好；但要規模化時，請把每一站的輸入與輸出都寫進資料庫或日誌。這樣一旦某天成品出包，你能精準回放「是哪一站、收到什麼、吐出什麼」，這是串接相對單一大 Prompt 最值錢的稽核能力，別在工程上把它浪費掉。當某一站需要即時讀外部資料（CRM、商品庫存、知識庫）時，也是在這一層把資料源接進來，再把結果用結構化格式往下傳。

第四，控制脈絡長度（context）。 鏈越長，越要警惕「每一站都把前面全部歷史貼進去」。正確做法是只傳下一站需要的最小欄位：第四站想標題時，它只需要第三站的貼文本文，根本不需要第一站的逐字稿。脈絡傳得精準，不只省 token，也讓每一站的注意力更集中、品質更穩。

常見錯誤

拆太細：把每個動詞都拆成一段，鏈條過長反而拖慢又增加成本。原則是「按任務性質拆」，不是「按句子拆」。
段間用自然語言傳遞：上一段吐一大段文字餵下一段，下一段常誤解。一定要用 JSON 或固定欄位。
不設驗證就串：以為每段都會乖乖照規格輸出，結果一段壞全鏈壞。關鍵節點務必加檢核與回退。
每段都重貼整份原始資料：在每一段都把 3000 字逐字稿再貼一次，浪費 token 又稀釋重點。只傳下一段真正需要的欄位。
沒鎖輸出格式：第一段沒要求純 JSON，模型多嘴加了「好的，以下是結果」，下一段解析就爆掉。明寫「只輸出 JSON，不要任何多餘文字」。
讓同一個模型既寫又評：自我檢查容易自我感覺良好，硬規則該交給程式、軟判斷該交給獨立評審站。

最佳實務

把以下幾點變成你串接的預設習慣：

先畫流程圖再寫 Prompt：節點、資料流向、驗證點先在紙上定清楚，再動手寫，能少改很多次。
每段都加一句「只根據上一段輸出作答」：收束模型的自由發揮，是串接穩定的便宜大補帖。
把驗證做成程式而非靠模型自評：字數、欄位、合法值這種硬規則，用程式檢查比叫模型自己檢查可靠得多。
保留每段的中間產物：出問題時可以快速定位是哪一站壞了，這正是串接相對單一大 Prompt 的最大優勢，別浪費掉。
先手動跑通再自動化：用複製貼上把整條鏈手動跑順、確認品質穩定後，再接進 Workflow 工具自動化。
替每一站立 System Prompt：把角色與禁區寫進 System Prompt，讓每站行為更收斂、更可重複。

實際案例一：台灣電商客服與內容團隊

情境：一家台灣中型電商的內容團隊，每週要把約 20 場客戶訪談錄音整理成社群素材。原本他們用一個塞滿要求的長 Prompt 一次處理，結果品質很不穩。

導入前：每篇成品平均要人工大改 2 次才能用，重點常抓錯、標題常只生出一兩個；一週 20 篇要花約 18 小時，且編輯抱怨「不知道 AI 哪裡會出包，每次都要從頭檢查」。

導入後：團隊把流程拆成上面那條四段串接鏈，並在第一段「萃取」後加了程式驗證（檢查重點數量與情緒值合法性），不合格自動回退重跑。同時改成只在第一段傳完整逐字稿，後面各段只傳必要欄位。

成果數據（團隊內部三個月統計，數字為該團隊實測，僅供參考）：

平均人工修改次數從 2 次降到 0.4 次，一次到位率約八成。
單週處理時間從約 18 小時降到約 7 小時，省下約六成工時。
因為中間產物看得見，編輯遇到問題能直接指出「是第一段萃取漏了」，除錯時間大幅縮短，新人也更容易上手。

關鍵轉變不在於用了多厲害的模型，而在於把任務拆對、把節點驗好。這正是 Prompt 串接最務實的價值。

實際案例二：在地電商客服的分支與評審鏈

情境：同一家電商，後來把串接用到了客服回覆草稿。客戶問題從 LINE 官方帳號進來，五花八門：有人問退貨、有人罵到飆髒話、有人只是想加購。一條線走到底顯然不夠，他們改用分支 + 評審的混合鏈。

做法：第一站先做「分流」，把訊息分類成「客訴／一般詢問／加購意圖」三類並輸出情緒分數；分類後走不同分支——客訴走安撫話術鏈、加購走推薦話術鏈。每條分支的最後都接一個獨立評審站，依固定規格檢查草稿「有沒有承諾做不到的事、語氣會不會火上加油、有無中國用語」，不過就回退重寫，過了才送給真人客服按下發送。

成果數據（團隊內部統計，僅供參考）：

客服首封回覆的草稿可用率從約五成提升到約九成，真人只需微調。
因分流精準，負面情緒客訴的平均首回時間從 12 分鐘縮短到約 4 分鐘。
評審站擋下的問題裡，「擅自承諾退款時程」這類風險回覆占了三成，等於提前攔住了潛在客訴升級。

這個案例的重點是：當任務本身會「因輸入而分歧」，就不要硬塞進一條線，用分支把路徑攤開、用評審站把品質收口，才是串接該有的樣子。

免責聲明

本文所引用的數據皆為文中虛構團隊的內部實測情境，僅供說明串接效益之用，不代表你導入後必能複製相同結果。實際成效會因任務性質、所用模型、資料品質與驗證設計而有很大差異，請以你自己環境的小規模試跑結果為準。

結論

複雜任務做不穩，問題往往不是 Prompt 寫得不夠長，而是你想用「一站」做完該由「一條生產線」完成的事。Prompt 串接的核心心法只有三句：拆成各做一件事的節點、用結構化格式對接、在關鍵點加驗證與回退。 把這三件事做到位，再加上獨立評審站與中繼產物落地，你的 AI 輸出就能從「碰運氣」變成「每次都穩、看得見、改得動、能上線」。

下一步，建議你先挑一個目前最讓你頭痛的多步驟任務，照本文五步驟把它拆成一條鏈，手動跑通後再考慮自動化。要把每一站的輸出鎖死，先精讀結構化輸出提示法；想把鏈條進化成能自主分工的系統，接著看多 Agent 協作；若你連單站 Prompt 都還想再打磨，回頭把 Prompt 工程框架練到滾瓜爛熟，整條鏈自然更穩。

❓ 常見問題 FAQ

Prompt Chaining 和把指令寫長一點有什麼不同？

差在可控性。一個塞滿十項要求的長 Prompt，模型很容易顧此失彼、漏掉中間幾項；串接是把十項拆成幾段、每段只專注一件事，前段輸出驗證過再進下一段，所以每一步都看得到、改得動、測得了。

串接會不會讓成本變高、速度變慢？

會多花 token 和時間，因為呼叫了多次模型。但對複雜任務來說，串接換來的是更高的一次成功率，反而減少了「整段重來」的浪費。簡單任務不必串，複雜或要上線的任務才值得拆。

段與段之間該用什麼格式傳資料？

盡量用 JSON 或固定欄位，不要用一段自然語言去餵下一段。結構化格式讓下一段能穩定解析、也方便你在中間插入程式做驗證或過濾，這是串接穩定的關鍵，建議搭配結構化輸出的技巧把每段輸出鎖死。

Prompt Chaining 和 AI Agent 是同一件事嗎？

不是，但有關係。串接是固定路線的多段提示，路徑由你預先設計好；多 Agent 協作則能讓多個 AI 自己決定下一步走哪。串接是 Agent 的基礎能力之一，先把固定鏈條練穩，再談讓 AI 自主決策。

中間某一段出錯，整條鏈會不會跟著壞掉？

如果沒設檢核就會，錯誤會一路被放大。正確做法是在關鍵節點加驗證與回退：輸出不符規格就重跑該段或轉人工，把錯誤擋在傳遞下去之前，這是串接和「一次到底」最大的差別。

每一段 Prompt 要不要都寫 System Prompt？

建議要。每一站給它一個專屬角色的 System Prompt（例如「你只負責萃取，不負責創作」），能大幅收束模型在該站的行為範圍，是讓每段穩定的便宜手段。

怎麼決定一個任務該拆成幾段？

用「任務性質」當切點，而不是「句子數量」。只要一個步驟同時包含理解、判斷、創作中的兩種以上就該拆；反之，性質相同、能一口氣做完的就別硬拆，鏈條太長反而拖慢又增加成本。

串接的每一段 Prompt 寫不出來怎麼辦？

可以先用 Prompt 框架把單段寫穩，再用 Prompt 產生器快速生出每一站的初稿，最後手動微調對接格式。先求每一站單獨會動，再談串起來。

🔗 延伸閱讀

這篇對你有幫助嗎？

AgentAI 智庫團隊 ✓ 台灣實作團隊

我們是一群專注於 AI Agent、Prompt 與自動化工作流的台灣實作者。每篇教學都附可複製配方、誠實標示實測程度與限制，只分享真正能落地、可直接套用的方法——與其介紹工具，不如教你把事情做完。

關於我們 →看更多教學 →訂閱情報週報 →

每週把這類實戰教學寄給你

訂閱 AgentAI 智庫情報週報，新的 Prompt、AI Skills、工作流與教學第一時間收到。

免費 · 隨時取消

Prompt 串接（Chaining）技巧：把複雜任務拆成多段提示，產出更穩定