超越手寫 Prompt:多 Agent 系統產品化的真正瓶頸與解方
目前多 Agent 系統的開發,多半還停留在為每個 Agent 手寫詳細的角色 Prompt。這種直觀卻脆弱的作法,正成為產品化的一大瓶頸。一篇新研究提出了「Agent Primitives」的概念,主張將複雜的協作行為拆解成可重用、可組合的「原語」,這正是讓多 Agent 系統真正走向穩定與規模化的關鍵一步。
過去一年,多 Agent 系統(Multi-Agent Systems, MAS)的發展確實令人興奮。然而,多數實作仍停留在一個相對初階的階段:為每個 Agent 手寫詳細的角色 Prompt,讓它們在模擬情境中互動。
我認為,這種依賴手寫角色的作法雖然是個有趣的起點,卻是通往真正產品化的一大瓶頸。要讓多 Agent 系統變得更強健、更通用,我們需要將思考層次從「撰寫角色劇本」提升到「設計協作架構」。一個更具潛力的方向,是將複雜的協作流程拆解成可重用、可組合、可驗證的「原語」(Primitives),建立一個更穩固的底層基礎。
為什麼手寫角色 Prompt 不是長久之計?
像是 ChatDev 或 MetaGPT 這類專案,透過為 CEO、工程師、測試人員等角色定義詳盡的 Prompt,成功模擬了一個軟體開發團隊的運作流程。這些展示很有啟發性,也證明了大型語言模型(LLM)具備角色扮演與執行複雜任務的能力。然而,當我們嘗試將這種模式應用到更廣泛、更動態的真實世界問題時,其脆弱性便顯而易見。
手寫 Prompt 的核心問題在於它的「隱性」與「脆弱」。系統的行為高度依賴 Prompt 的細微措辭,微小的調整就可能導致完全不同的結果,使其難以預測與除錯。
此外,這種方法也缺乏通用性——為軟體開發設計的 Agent 角色,無法輕易地遷移到學術研究或市場分析等其他領域,每次都需要重新設計一套全新的角色與互動規則。這使得系統的擴展與維護成本極高,離真正的工程化與產品化還有很長一段距離。
當我們把所有複雜性都塞進一個巨大的 Prompt 黑盒子時,我們失去的是對系統行為的可控性、可驗證性與可組合性。
Agent Primitives 如何解決這個問題?
一篇發表於 2026 年 2 月 3 日的論文 《Agent Primitives: Reusable Latent Building Blocks for Multi-Agent Systems》,提出了一個極具洞見的解決方案。研究者主張,我們應該將 Agent 之間複雜的協作行為,分解為一組更小、更基礎的「原語」。這些原語就像是程式語言中的函式庫或是樂高積木,是構成所有複雜互動的最小單位。
這篇研究將多樣的協作模式歸納為三大核心原語:
- Review (審查):一個 Agent 評估另一個 Agent 產出的能力,提供回饋或修正建議。
- Voting (投票):多個 Agent 針對一個提案或選項進行表決,以達成共識。
- Planning (規劃):一個或多個 Agent 將複雜目標分解為一系列可執行的子任務。
透過將這些原語模組化,開發者可以像組合函式一樣,彈性地建構出各種複雜的協作流程,而無需從頭撰寫冗長的 Prompt。更關鍵的是,這篇論文提出讓這些原語在模型的「潛在空間」(Latent Space)中直接溝通,例如透過 KV Cache 進行內部資訊交換。這不僅大幅提升了效率,也減少了在自然語言轉換過程中可能發生的資訊損失與歧義,讓 Agent 之間的協作更精確、更可靠。
這對我們建構 AI 系統有什麼啟示?
「Agent Primitives」這個概念,為多 Agent 系統的工程實踐帶來了重要的啟示。它標誌著一種思維轉變:從「Prompt 藝術家」轉向「系統架構師」。我們的重點不再是雕琢完美的角色描述,而是設計穩固的互動協議與可重用的功能模組。
這種模組化、結構化的思維,其實已經在一些前沿的開發框架中看到雛形。
例如,LangGraph 就引入了「圖」的概念來定義 Agent 的狀態與轉換,這本質上就是一種將協作流程明確化、結構化的嘗試。業界如 Anthropic 也在探索更系統化的多 Agent 研究框架,而 OpenAI 的 Cookbook 也開始討論如何有效地「編排」(Orchestrating)多個 Agent。這些都指向同一個未來:要讓多 Agent 系統真正落地,我們必須超越 Prompt 的表層,深入到底層的互動結構。
將協作行為拆解為原語,不僅能提升系統的穩定性與通用性,更重要的是它讓「驗證」成為可能。我們可以針對單一的 Review 或 Voting 原語進行單元測試,確保其行為符合預期,這在傳統的手寫 Prompt 模式下幾乎是不可能的。當我們能對系統的最小單位進行驗證,我們才真正有信心去建構更大型、更複雜、更可靠的 AI 系統。
總結來說,多 Agent 系統的未來,不會只停留在模擬各種社會角色的趣味實驗。真正的突破將來自於我們能否發展出一套標準化的協作原語與架構,讓開發者能以工程化的方式,穩定、高效地建構出能解決實際問題的複雜 AI 系統。這條路才剛開始,但方向已經非常清晰。
延伸閱讀
- Agent Primitives: Reusable Latent Building Blocks for Multi-Agent Systems
- Anthropic: Building a multi-agent research system
- LangChain LangGraph
- OpenAI Cookbook: Orchestrating multiple agents for complex tasks
我是江中喬,一位具有 TPM 與產品管理背景的 AI 系統建構者,目前專注於 AI 認知增強系統與多 Agent 協作架構的設計與實踐。