同一段 Prompt、同一個模型,今天跑出來的答案精準好用,明天卻像換了個人在亂講——很多人以為是 AI 不穩,其實常常是參數沒調對。
這篇要解決的問題:把 Temperature、Top-p 這些看起來很技術的參數,講成你聽得懂、立刻能動手的設定法。 適合誰讀:用 ChatGPT、Claude、Gemini 寫文案、做客服、跑自動化的人,會用 API 或 Playground 更好,純聊天介面也用得上。 讀完你會得到:一張參數對照表、一套調校流程圖、可複製的 Prompt,以及台灣客服與行銷的實戰調法。
為什麼參數設定值得你花十分鐘搞懂?
大多數人寫 Prompt 寫得很認真,卻完全沒碰參數,全部用預設值。問題是:預設值是「給所有任務的折衷」,不是給你這個任務的最佳解。
舉個實際情況。你要 AI 幫公司寫「退費政策的標準回覆」,這需要每次都一樣、不能自由發揮;同一個你又要它「想 30 個活動標語」,這需要天馬行空。這兩種任務,理想的參數是相反的。如果都用同一組預設值,前者偶爾會冒出不該講的話,後者又顯得保守無聊。
懂一點參數,等於多了一個旋鈕:該穩的時候轉穩、該野的時候放野。這比你反覆改 Prompt 還省力,而且效果立竿見影。台灣不少中小企業導入 AI 客服時卡關,問題不在模型不夠強,而在沒人告訴他們「客服要把 Temperature 調低」。
核心概念:AI 是怎麼「選下一個字」的?
要理解參數,得先知道 AI 生成文字的底層動作其實只有一件事:不斷預測「下一個字最可能是什麼」。
模型每次都會算出一大堆候選字,每個字配一個機率。例如你打「今天天氣真」,模型內部可能是:
| 候選字 | 模型給的機率 |
|---|---|
| 好 | 60% |
| 熱 | 20% |
| 差 | 10% |
| 藍 | 5% |
| 香 | 0.5% |
接下來怎麼從這些候選字裡選一個,就是參數在管的事。
- Temperature(溫度):像在調「機率差距的對比度」。溫度低,差距被放大,高機率的「好」幾乎一定被選中,答案穩定;溫度高,差距被壓平,連「藍」「香」這種冷門字也有機會出線,答案更發散、有時更有創意,但也更容易離題或出錯。
- Top-p(核採樣):像在「先畫一個圈再抽籤」。Top-p = 0.9 表示「把機率從高到低累加,加到 90% 為止的這幾個字才納入考慮」,後面的長尾冷門字直接排除。p 越小,圈越小、用字越收斂。
一個生活化比喻:Temperature 是調整骰子「灌不灌鉛」(低溫=灌鉛,幾乎都擲到同一面);Top-p 是決定「這顆骰子有幾個面可以擲」(p 小=只剩三四個面)。兩者都在控制隨機性,但切入點不同。
還有幾個常見參數順帶記住:
| 參數 | 作用 | 白話 |
|---|---|---|
| Temperature | 控制隨機性/創意度 | 答案要穩還是要野 |
| Top-p | 限制候選字範圍 | 從多少候選字裡抽 |
| max tokens | 限制輸出長度 | 最多能講多長 |
| frequency penalty | 抑制重複字詞 | 別一直講同個詞 |
| presence penalty | 鼓勵帶入新主題 | 多換點話題 |
實際教學:五步把參數調到位
Step 1:先定義任務性質(穩定還是發散)
動手前先問自己一句話:這個任務,我要的是「每次都一樣的正確」,還是「每次都不一樣的點子」?
- 要一致正確:客服回覆、資料萃取、翻譯、程式碼、財報摘要 → 走「穩定路線」。
- 要多樣發想:命名、標語、品牌故事、腦力激盪 → 走「創意路線」。
- 介於中間:一般文案、Email、報告 → 走「平衡路線」。
這一步決定後面所有數值的方向,別跳過。
Step 2:設定 Temperature
依上一步的判斷,從這張建議值起步(不是鐵律,是好用的起點):
| 任務類型 | 建議 Temperature | 例子 |
|---|---|---|
| 穩定一致 | 0 ~ 0.3 | 客服標準回覆、資料萃取、翻譯、程式 |
| 平衡 | 0.5 ~ 0.7 | 一般文案、Email、報告、摘要 |
| 創意發散 | 0.8 ~ 1.0 | 命名、標語、廣告點子、故事發想 |
先用建議值跑,不滿意再微調。要更穩就往下 0.1,要更野就往上 0.1。
Step 3:調整 Top-p(多數時候別亂動)
實務上有個重要原則:Temperature 和 Top-p 不要同時大改,否則你會搞不清楚是哪個在影響結果。
- 多數情況:Top-p 固定在 0.9~1.0,只調 Temperature 就好,這是最省心的做法。
- 想讓用詞更收斂、更「規矩」:把 Top-p 降到 0.7 左右,模型會避開冷門字。
- 結論:新手先把 Top-p 設 0.9 鎖住,把心力放在 Temperature。
Step 4:設定 max tokens 與護欄
- max tokens:依你需要的輸出長度抓。一句客服回覆設小一點(避免它落落長),長報告設大一點。記得這是「上限」,太小會被硬切斷。
- 護欄:低 Temperature 不等於不會亂講。請在 Prompt 內補上文字護欄,例如「只根據我提供的資料回答,沒有的就說『資料未提供』,不要自行臆測」。參數管隨機性,Prompt 管事實邊界,兩者要搭配。
Step 5:小批量測試後固定下來
別只跑一次就下結論。用同一組 Prompt 連跑 5~10 次:
- 穩定型任務:看 5 次答案是不是夠像、有沒有亂承諾的句子。
- 創意型任務:看 10 個點子有沒有重複、夠不夠多元。
找到滿意的甜蜜點後,把「模型 + Temperature + Top-p + max tokens」這組設定寫進團隊文件固定下來,之後直接套用,不用每次重調。
範例:Prompt 與 Workflow
可複製 Prompt(穩定型:客服標準回覆)
搭配參數設定:Temperature 0.2、Top-p 0.9、max tokens 約 300。
你是某電商的資深客服主管,負責產出對外的標準回覆。
任務:根據下方「公司政策」回覆顧客問題,語氣有禮、簡潔、台灣口語。
公司政策:[貼上你的退換貨/運費/到貨政策]
顧客問題:[貼上顧客訊息]
規則(護欄):
1. 只根據上面的公司政策回答,政策沒寫到的,回「這部分我幫您轉專人確認」,不要自己編。
2. 不主動承諾政策外的優惠或時程。
3. 同樣的問題,每次都要給一致的答覆。
輸出:一段可以直接貼給顧客的回覆,繁體中文台灣用語。
可複製 Prompt(創意型:活動標語發想)
搭配參數設定:Temperature 0.9、Top-p 1.0、max tokens 約 500。
你是台灣在地的廣告創意總監。
任務:為「[品牌/活動名稱]」想 30 句活動標語。
背景:[受眾、調性、想凸顯的賣點]
要求:
1. 30 句風格要多元,從理性、感性、幽默、文青都各來幾句。
2. 用台灣口語,避免翻譯腔與空泛形容詞。
3. 用條列輸出,每句後面用括號標一下風格。
Workflow 流程圖(文字版)
判斷任務性質
↓
是「要一致正確」嗎?
├─ 是 → Temperature 0~0.3、Top-p 0.9 → 加事實護欄
└─ 否 → 是「要多樣發想」嗎?
├─ 是 → Temperature 0.8~1.0、Top-p 1.0
└─ 否(平衡)→ Temperature 0.5~0.7、Top-p 0.9
↓
設定 max tokens(依輸出長度)
↓
同一 Prompt 連跑 5~10 次測試
↓
夠穩/夠多元了嗎?
├─ 否 → 微調 Temperature ±0.1 → 回到測試
└─ 是 → 寫進團隊文件固定設定
常見錯誤
- 以為 Temperature 越高越聰明:高溫只是更隨機,不是更厲害。寫程式、抓資料時調高溫,只會換來更多錯誤。
- Temperature 和 Top-p 同時亂調:兩個都動會互相干擾,結果無法歸因。先鎖一個。
- 把 Temperature 0 當成「保證完全一樣」:它只是大幅降低隨機性,仍可能有微小差異,模型版本更新也會讓輸出變。要可重複,得連同 Prompt、版本、格式一起鎖。
- 只跑一次就下定論:尤其創意型任務,要多跑幾次才看得出穩定度與多樣性。
- 靠調高溫來「擠出創意」卻沒給素材:創意來自好的背景與限制,不是純靠亂數。Prompt 給夠脈絡,比硬拉溫度有效。
- 忘了 max tokens 導致答案被切斷:輸出突然斷尾,多半是上限設太小,不是模型壞掉。
最佳實務
- 新手只調 Temperature:Top-p 固定 0.9,把九成心力放在一個旋鈕上,最划算。
- 建一張「任務 → 參數」對照表:把公司常見任務(客服、文案、命名、摘要)對應的建議參數寫成表,全團隊照表操課。
- 參數搭配護欄一起用:參數降隨機、Prompt 設邊界,雙保險才能真的穩。
- 重要任務做版本紀錄:把模型名稱、參數、Prompt 一起存檔,日後出問題才追得到原因。
- 先驗證再規模化:小批量測穩了,再接進自動化流程或 Agent,別一上來就全自動。
- 善用現成模板:不想每次從零調,可到 AgentAI 智庫的 Prompt 產生器 與 AI Skills 食譜庫 直接套用已調好的任務範本。
實際案例:台灣電商客服導入參數調校
情境:台中一家經營保健食品的電商,約 25 人團隊,客服每天要回上百則「運費、退換貨、到貨時間」的重複問題。他們導入 AI 客服輔助,初期卻吃了悶虧。
導入前(用預設參數):團隊直接拿聊天介面的預設值(約中間溫度)讓 AI 草擬回覆。結果同一個「我可以退貨嗎」的問題,AI 三次給出三種說法,有一次甚至主動承諾了「七天無條件退費還免運」這個公司根本沒有的政策,客服得逐則重看重改,等於沒省到力,還多了把關風險。
調整動作:
- 把 Temperature 從預設降到 0.2、Top-p 固定 0.9。
- 在 Prompt 內貼上完整公司政策,加上護欄「只依政策回答,沒寫的轉專人,不主動給優惠」。
- max tokens 設小,逼回覆精簡。
- 拿 20 題常見問題各跑 5 次驗證一致性,再上線。
導入後成果(兩個月觀察):
- 相同問題的回覆一致性大幅提升,AI 草稿「直接可用、免改」的比例從約 4 成提升到約 8 成。
- 客服平均處理一則訊息的時間,從約 3 分鐘縮短到約 1 分鐘。
- 「亂承諾政策」的狀況在驗證階段就被攔下,上線後未再發生對外錯誤承諾。
- 客服人力得以從重複回覆,挪去處理真正需要判斷的客訴與顧客關係。
關鍵心得:他們沒有換更貴的模型,只是「把溫度調低、加上護欄、先測再上」。對中小企業來說,參數調校是投報率很高的一步。
免責聲明:本文參數建議值為通用起點,不同模型與版本的實際表現會有差異,請以你自己的小批量測試結果為準。涉及對外承諾、金額、法律或醫療相關回覆時,務必保留人工審核,AI 輸出僅供輔助。
結論
參數設定不是工程師的專利,而是每個用 AI 工作的人都該會的基本功。記住三件事就夠你上手:先判斷任務要穩還是要野、新手只調 Temperature(Top-p 固定 0.9)、參數一定要搭配 Prompt 護欄與小批量測試。
把「穩定路線 0~0.3、平衡 0.5~0.7、創意 0.8~1.0」這組數字記在心裡,下次 AI 答案亂跑或太無聊時,你就知道該轉哪個旋鈕。想更進一步把調好的設定變成可重複的流程,歡迎參考 ChatGPT Prompt 教學 與 AI Agent 入門,讓參數、Prompt 與工作流真正搭成一套。
❓ 常見問題 FAQ
Temperature 到底是什麼?用一句話解釋。
Temperature 和 Top-p 有什麼差別?兩個都要調嗎?
客服自動回覆應該設多少 Temperature?
為什麼我把 Temperature 設成 0,答案還是偶爾不一樣?
ChatGPT、Claude 的對話介面看不到這些參數,怎麼辦?
🔗 延伸閱讀
每週把這類實戰教學寄給你
訂閱 AgentAI 智庫情報週報,新的 Prompt、AI Skills、工作流與教學第一時間收到。
免費 · 隨時取消