Prompt 串接(Chaining)技巧:把複雜任務拆成多段提示,產出更穩定

寫 Prompt 遇到複雜任務時,大多數人的直覺是「把要求寫得更詳細、更長」,結果指令越塞越多,模型卻越來越常漏掉中間幾項、輸出時好時壞。這篇文章要教你另一條路——Prompt 串接(Chaining):把一個大任務拆成幾段各自只做一件事的提示,讓前一段的輸出餵進下一段,逐段把品質鎖死。 適合已經會寫 Prompt、但一碰到多步驟任務就失控的工作者,以及準備把 AI 放進正式流程的團隊。讀完你會得到可直接複製的串接 Prompt 模板、四種常見串接模式,以及判斷「哪些任務該拆、怎麼拆」的方法。

如果你還在打基礎,建議先看完 ChatGPT 提示詞攻略Prompt 工程框架大全,確定單一 Prompt 已經寫得夠穩,再回來學「把多個穩定 Prompt 接成一條可靠的鏈」這門進階功夫。

為什麼複雜任務不能用一個大 Prompt 解決?

先講一個很多人都踩過的坑。假設你要 AI 做一件事:「讀一篇 3000 字的訪談逐字稿,抓出重點、判斷情緒、寫成一則 100 字社群貼文、再給三個標題。」你把這四項要求全部塞進一個 Prompt,跑出來的結果通常是——重點抓得馬虎、情緒判斷被忽略、貼文倒是寫了、標題剩兩個。

這不是模型笨,而是單一 Prompt 的注意力會被稀釋。當一段指令同時要求模型「理解、判斷、創作、發想」四種不同性質的工作,它很難每一項都全力以赴,越後面的要求越容易被犧牲。這跟你叫一個人「一邊聽電話、一邊算帳、一邊寫文案」是一樣的道理。

硬把 Prompt 寫長還會帶來三個副作用。第一是難除錯:結果不好,你根本不知道是哪一項要求出了問題,只能整段重寫。第二是難維護:十項要求糾纏在一段文字裡,改 A 常常不小心動到 B。第三是難規模化:這種巨無霸 Prompt 沒辦法被乾淨地接進自動化 Workflow,因為它的中間產物全藏在模型腦袋裡,外部程式拿不到。

還有一個比較隱形、但很致命的副作用:錯誤無法被攔截。在一個大 Prompt 裡,模型如果第一步「抓重點」就抓歪了,它會帶著歪掉的重點繼續寫貼文、繼續想標題,而你完全看不到中間發生了什麼。等成品出來你才發現不對,卻已經無從得知是哪一環先壞的。Prompt 串接要解決的,就是把「一口氣做完」改成「分段完成、逐段驗收」,讓每一個環節都攤在陽光下。

核心概念:什麼是 Prompt 串接?

Prompt 串接(Prompt Chaining)的定義很簡單:把一個複雜任務拆成多個子任務,每個子任務用獨立的 Prompt 處理,並把前一段的輸出當作後一段的輸入,串成一條有順序的鏈條。

最好的比喻是工廠的生產線。一個複雜產品不會由一個師傅從頭做到尾,而是拆成數個工站:第一站只負責裁切、第二站只負責組裝、第三站只負責品檢。每一站專注一件事、做完交給下一站,且每一站都能單獨檢查良率。Prompt 串接就是把 AI 任務變成這樣一條生產線——每一段提示是一個工站。

要注意,串接處理的是「不同性質、要分站做」的任務切分;它和 思維鏈(Chain of Thought) 是兩個層次的事。思維鏈是在同一段 Prompt 裡,要求模型把推理步驟「想出來、寫出來」以提高單站準確度;串接則是把不同段 Prompt 接起來。實務上兩者常一起用:在「需要判斷」的那一站內部用思維鏈讓它想清楚,再把結論用結構化格式交給下一站。

下面這張表把「單一大 Prompt」和「串接」的差別講清楚:

比較項目單一大 PromptPrompt 串接
注意力同時扛多種任務,容易顧此失彼每段只專注一件事,品質集中
除錯出錯不知問題在哪,只能整段重來哪一段壞了一目了然,單獨改
中間產物藏在模型腦中,外部拿不到每段輸出都看得見、可驗證
串接系統難接進自動化流程天生適合接成 Workflow
成本控制一次失敗整段重跑,浪費大只重跑壞掉那一段,浪費小
適合場景簡單、單一性質的任務多步驟、跨性質的複雜任務

要特別釐清一個常見誤會:Prompt 串接不等於多 Agent 系統。串接是你預先設計好固定路線的多段提示,AI 只負責執行每一站,不自己決定要走哪條路;多 Agent 協作 則能讓多個 AI 根據情況自主決定下一步、彼此分工。串接是邁向 Agent 的基礎能力,先把固定鏈條練穩,再談讓 AI 自主決策才有意義。

實際教學:五步驟拆出一條穩定的鏈

我們用一個真實任務貫穿全部步驟:把一篇客戶訪談逐字稿,加工成一則社群貼文與三個標題。這是台灣內容、行銷團隊每天都在做的事。

Step 1:拆解任務節點

先別碰 Prompt,先拿張紙把任務拆成「各自只做一件事」的節點。上面的任務可以拆成四站:

  1. 萃取:從逐字稿抓出 5 個重點與整體情緒。
  2. 定調:根據重點與情緒,決定貼文要走的角度與語氣。
  3. 撰寫:寫出一則 100 字貼文。
  4. 發想:根據貼文產出三個標題。

判斷該不該拆的原則:只要一個步驟同時包含「理解」「判斷」「創作」中的兩種以上,就該拆。 萃取是理解、定調是判斷、撰寫與發想是創作,性質都不同,所以拆開。

Step 2:設計每段的輸入輸出

為每一站明確定義「收到什麼、吐出什麼」。這一步是串接能不能對接的關鍵——上一站的輸出格式,必須剛好是下一站需要的輸入格式。

設計輸入輸出時,最容易被忽略的是「只傳下一站真正需要的欄位」。第三站不需要整份逐字稿,只需要重點與語氣;硬把 3000 字逐字稿一路傳到底,只會稀釋重點又燒 token。

Step 3:鎖定中繼格式

段與段之間,一律用 JSON 或固定欄位傳遞,不要用一段自然語言去餵下一段。自然語言模糊、容易讓下一段誤解;結構化格式讓下一段穩定解析,也方便你在中間插程式做驗證或過濾。這背後其實是一整套技巧,值得單獨花時間練——可參考 結構化輸出提示法 把「逼模型只吐乾淨 JSON」這件事做到滴水不漏。

例如第一站的輸出固定成這樣:

{
  "points": ["重點一", "重點二", "重點三", "重點四", "重點五"],
  "emotion": "正面 / 中性 / 負面",
  "quote": "最有代表性的一句客戶原話"
}

第二站就能穩穩地讀到 pointsemotionquote 三個欄位,不會猜錯。如果某些站的輸出格式很挑、模型常出錯,可以在該站的 Prompt 裡放一兩個「輸入長這樣、輸出就該長這樣」的範例,也就是 Few-shot 範例提示法,用示範把格式釘死,比純文字說明更可靠。

Step 4:串接並傳遞變數

把前一段輸出當變數,用 {{變數}} 的方式塞進下一段 Prompt,逐段執行。手動操作時就是「複製上一段的 JSON、貼進下一段的指定位置」;自動化時則由程式或 Workflow 工具自動傳遞。重點是每一段 Prompt 都明寫「你會收到 {{上一段輸出}},請只根據它作答」,避免模型自由發揮。

另外建議替每一站都配一個專屬角色的 System Prompt,例如第一站固定是「你是只負責萃取、不負責創作的資深企劃」。把角色寫進 System 層而非每次都塞在使用者訊息裡,能讓該站的行為更穩定、也更省事。

Step 5:加檢核與回退

串接最大的風險是錯誤會一路放大:第一站重點抓錯,後面三站全部跟著錯。所以要在關鍵節點加驗證——例如第一站輸出後,先用程式檢查「是不是剛好 5 個重點、emotion 是不是三個合法值之一」。不合格就回退重跑該段,或在難判斷時轉人工,把錯誤擋在傳下去之前。這是串接和「一次到底」最本質的差別。

範例:Prompt 與 Workflow

下面是可直接複製的四段串接 Prompt。每一段都標明了輸入變數與輸出格式。

【第一段:萃取】
你是資深內容企劃,只負責萃取,不負責創作。
輸入逐字稿:{{transcript}}
請輸出嚴格的 JSON,不要多餘文字:
{
  "points": [5 個重點,每個 20 字內],
  "emotion": "正面 或 中性 或 負面",
  "quote": "最有代表性的一句客戶原話"
}
若資訊不足以湊滿 5 個重點,points 寧可少於 5 個也不要編造。

【第二段:定調】
你是社群編輯。收到上一段的萃取結果:{{stage1_json}}
請根據 points 與 emotion,輸出 JSON:
{
  "angle": "這則貼文要切的角度,一句話",
  "tone": "語氣,例如 溫暖 / 專業 / 活潑"
}

【第三段:撰寫】
你是社群文案。收到角度與語氣:{{stage2_json}},以及重點:{{stage1_points}}
請寫一則繁體中文(台灣用語)貼文,限 100 字內,語氣依 tone。
只輸出貼文本文,不要解釋。

【第四段:發想標題】
你是標題編輯。收到貼文:{{stage3_text}}
請輸出 3 個吸睛標題,每個 15 字內,風格各不同(疑問式 / 數據式 / 情緒式)。
以 JSON 陣列輸出。

文字版 Workflow 流程圖如下:

逐字稿輸入

[第一段:萃取] → 輸出 重點清單 + 情緒 (JSON)

[驗證] 是否剛好 5 個重點、emotion 合法?
   ↓ 否 → 回退重跑第一段 / 轉人工
   ↓ 是
[第二段:定調] → 輸出 角度 + 語氣 (JSON)

[第三段:撰寫] → 輸出 100 字貼文

[驗證] 字數是否 ≤ 100、語氣是否符合?
   ↓ 否 → 回退重跑第三段
   ↓ 是
[第四段:發想] → 輸出 3 個標題

完稿輸出(貼文 + 標題)

每一段 Prompt 都不必從零手寫。你可以用 Prompt 產生器 先生出每一站的初稿,再依本文的輸入輸出規格微調對接欄位,能省下大量打字時間。想找更多可直接套用的串接模板,也可以參考 Prompt 資料庫

四種常見串接模式

串接不只有「一條線走到底」這一種。實務上有四種模式,可以混搭:

掌握這四種模式後,你就能組合出相當複雜的流程,這也是邁向 多 Agent 協作 的前置基礎。

進階:更深入的一層

學會把鏈接起來之後,真正讓串接「上得了正式流程」的,是底下這幾層多數教學不會講的眉角。

第一,用「評審站」取代讓模型自我檢查。 很多人會在最後一站叫模型「請檢查上面寫得好不好」,但同一個模型既當運動員又當裁判,往往會自我感覺良好。更穩的做法是新增一個獨立的評審站(Critique Stage),給它一份明確的評分規格(例如:是否扣題、字數是否達標、有無中國慣用詞),讓它對前一站的輸出打分並指出問題;分數不過就回退重寫。要把評審規格寫得乾淨、可重用,可以用 Meta Prompting(讓 AI 幫你寫 Prompt) 先請模型替你產出一份嚴謹的評分準則,再固定成這一站的 System Prompt。

第二,分清「硬規則」和「軟判斷」,用不同方式驗證。 字數、欄位齊不齊、列舉值合不合法——這些是硬規則,務必用程式檢查,模型自評不可靠。語氣對不對、有沒有抓到客戶真正在意的點——這些是軟判斷,才交給評審站處理。把兩者混在一起,會讓你既擋不住低級錯誤、又浪費模型算力。

下面這張表幫你把「進階機制」對應到「適用情境」:

進階機制解決什麼問題什麼時候用
評審站(Critique)模型自評不客觀、品質飄忽對外發布、品質要求高的鏈
程式硬驗證字數、欄位、列舉值出錯任何要接進自動化的鏈
迴圈重寫(Loop)一次寫不到位、需逐步逼近字數/格式/風格要反覆收斂時
分支路由(Branching)不同輸入要走不同處理客服分流、情緒分流等
中繼資料落地出錯難回溯、無法追責規模化、要稽核的正式流程

第三,把中繼產物落地保存。 在玩具階段,中間 JSON 用複製貼上就好;但要規模化時,請把每一站的輸入與輸出都寫進資料庫或日誌。這樣一旦某天成品出包,你能精準回放「是哪一站、收到什麼、吐出什麼」,這是串接相對單一大 Prompt 最值錢的稽核能力,別在工程上把它浪費掉。當某一站需要即時讀外部資料(CRM、商品庫存、知識庫)時,也是在這一層把資料源接進來,再把結果用結構化格式往下傳。

第四,控制脈絡長度(context)。 鏈越長,越要警惕「每一站都把前面全部歷史貼進去」。正確做法是只傳下一站需要的最小欄位:第四站想標題時,它只需要第三站的貼文本文,根本不需要第一站的逐字稿。脈絡傳得精準,不只省 token,也讓每一站的注意力更集中、品質更穩。

常見錯誤

最佳實務

把以下幾點變成你串接的預設習慣:

  1. 先畫流程圖再寫 Prompt:節點、資料流向、驗證點先在紙上定清楚,再動手寫,能少改很多次。
  2. 每段都加一句「只根據上一段輸出作答」:收束模型的自由發揮,是串接穩定的便宜大補帖。
  3. 把驗證做成程式而非靠模型自評:字數、欄位、合法值這種硬規則,用程式檢查比叫模型自己檢查可靠得多。
  4. 保留每段的中間產物:出問題時可以快速定位是哪一站壞了,這正是串接相對單一大 Prompt 的最大優勢,別浪費掉。
  5. 先手動跑通再自動化:用複製貼上把整條鏈手動跑順、確認品質穩定後,再接進 Workflow 工具自動化。
  6. 替每一站立 System Prompt:把角色與禁區寫進 System Prompt,讓每站行為更收斂、更可重複。

實際案例一:台灣電商客服與內容團隊

情境:一家台灣中型電商的內容團隊,每週要把約 20 場客戶訪談錄音整理成社群素材。原本他們用一個塞滿要求的長 Prompt 一次處理,結果品質很不穩。

導入前:每篇成品平均要人工大改 2 次才能用,重點常抓錯、標題常只生出一兩個;一週 20 篇要花約 18 小時,且編輯抱怨「不知道 AI 哪裡會出包,每次都要從頭檢查」。

導入後:團隊把流程拆成上面那條四段串接鏈,並在第一段「萃取」後加了程式驗證(檢查重點數量與情緒值合法性),不合格自動回退重跑。同時改成只在第一段傳完整逐字稿,後面各段只傳必要欄位。

成果數據(團隊內部三個月統計,數字為該團隊實測,僅供參考):

關鍵轉變不在於用了多厲害的模型,而在於把任務拆對、把節點驗好。這正是 Prompt 串接最務實的價值。

實際案例二:在地電商客服的分支與評審鏈

情境:同一家電商,後來把串接用到了客服回覆草稿。客戶問題從 LINE 官方帳號進來,五花八門:有人問退貨、有人罵到飆髒話、有人只是想加購。一條線走到底顯然不夠,他們改用分支 + 評審的混合鏈。

做法:第一站先做「分流」,把訊息分類成「客訴/一般詢問/加購意圖」三類並輸出情緒分數;分類後走不同分支——客訴走安撫話術鏈、加購走推薦話術鏈。每條分支的最後都接一個獨立評審站,依固定規格檢查草稿「有沒有承諾做不到的事、語氣會不會火上加油、有無中國用語」,不過就回退重寫,過了才送給真人客服按下發送。

成果數據(團隊內部統計,僅供參考):

這個案例的重點是:當任務本身會「因輸入而分歧」,就不要硬塞進一條線,用分支把路徑攤開、用評審站把品質收口,才是串接該有的樣子。

免責聲明

本文所引用的數據皆為文中虛構團隊的內部實測情境,僅供說明串接效益之用,不代表你導入後必能複製相同結果。實際成效會因任務性質、所用模型、資料品質與驗證設計而有很大差異,請以你自己環境的小規模試跑結果為準。

結論

複雜任務做不穩,問題往往不是 Prompt 寫得不夠長,而是你想用「一站」做完該由「一條生產線」完成的事。Prompt 串接的核心心法只有三句:拆成各做一件事的節點、用結構化格式對接、在關鍵點加驗證與回退。 把這三件事做到位,再加上獨立評審站與中繼產物落地,你的 AI 輸出就能從「碰運氣」變成「每次都穩、看得見、改得動、能上線」。

下一步,建議你先挑一個目前最讓你頭痛的多步驟任務,照本文五步驟把它拆成一條鏈,手動跑通後再考慮自動化。要把每一站的輸出鎖死,先精讀 結構化輸出提示法;想把鏈條進化成能自主分工的系統,接著看 多 Agent 協作;若你連單站 Prompt 都還想再打磨,回頭把 Prompt 工程框架 練到滾瓜爛熟,整條鏈自然更穩。

❓ 常見問題 FAQ

Prompt Chaining 和把指令寫長一點有什麼不同?
差在可控性。一個塞滿十項要求的長 Prompt,模型很容易顧此失彼、漏掉中間幾項;串接是把十項拆成幾段、每段只專注一件事,前段輸出驗證過再進下一段,所以每一步都看得到、改得動、測得了。
串接會不會讓成本變高、速度變慢?
會多花 token 和時間,因為呼叫了多次模型。但對複雜任務來說,串接換來的是更高的一次成功率,反而減少了「整段重來」的浪費。簡單任務不必串,複雜或要上線的任務才值得拆。
段與段之間該用什麼格式傳資料?
盡量用 JSON 或固定欄位,不要用一段自然語言去餵下一段。結構化格式讓下一段能穩定解析、也方便你在中間插入程式做驗證或過濾,這是串接穩定的關鍵,建議搭配 結構化輸出 的技巧把每段輸出鎖死。
Prompt Chaining 和 AI Agent 是同一件事嗎?
不是,但有關係。串接是固定路線的多段提示,路徑由你預先設計好;多 Agent 協作 則能讓多個 AI 自己決定下一步走哪。串接是 Agent 的基礎能力之一,先把固定鏈條練穩,再談讓 AI 自主決策。
中間某一段出錯,整條鏈會不會跟著壞掉?
如果沒設檢核就會,錯誤會一路被放大。正確做法是在關鍵節點加驗證與回退:輸出不符規格就重跑該段或轉人工,把錯誤擋在傳遞下去之前,這是串接和「一次到底」最大的差別。
每一段 Prompt 要不要都寫 System Prompt?
建議要。每一站給它一個專屬角色的 System Prompt(例如「你只負責萃取,不負責創作」),能大幅收束模型在該站的行為範圍,是讓每段穩定的便宜手段。
怎麼決定一個任務該拆成幾段?
用「任務性質」當切點,而不是「句子數量」。只要一個步驟同時包含理解、判斷、創作中的兩種以上就該拆;反之,性質相同、能一口氣做完的就別硬拆,鏈條太長反而拖慢又增加成本。
串接的每一段 Prompt 寫不出來怎麼辦?
可以先用 Prompt 框架 把單段寫穩,再用 Prompt 產生器 快速生出每一站的初稿,最後手動微調對接格式。先求每一站單獨會動,再談串起來。

🔗 延伸閱讀

幫這篇打個分:
A
AgentAI 智庫團隊 ✓ 台灣實作團隊

我們是一群專注於 AI Agent、Prompt 與自動化工作流的台灣實作者。每篇教學都附可複製配方、誠實標示實測程度與限制,只分享真正能落地、可直接套用的方法——與其介紹工具,不如教你把事情做完。

關於我們 →看更多教學 →訂閱情報週報 →

每週把這類實戰教學寄給你

訂閱 AgentAI 智庫情報週報,新的 Prompt、AI Skills、工作流與教學第一時間收到。

免費 · 隨時取消