mk-brain

超越手寫 Prompt：多 Agent 系統產品化的真正瓶頸與解方

目前多 Agent 系統的開發，多半還停留在為每個 Agent 手寫詳細的角色 Prompt。這種直觀卻脆弱的作法，正成為產品化的一大瓶頸。一篇新研究提出了「Agent Primitives」的概念，主張將複雜的協作行為拆解成可重用、可組合的「原語」，這正是讓多 Agent 系統真正走向穩定與規模化的關鍵一步。

江中喬

21 5月 2026 • 5 min read

過去一年，多 Agent 系統（Multi-Agent Systems, MAS）的發展確實令人興奮。然而，多數實作仍停留在一個相對初階的階段：為每個 Agent 手寫詳細的角色 Prompt，讓它們在模擬情境中互動。

我認為，這種依賴手寫角色的作法雖然是個有趣的起點，卻是通往真正產品化的一大瓶頸。要讓多 Agent 系統變得更強健、更通用，我們需要將思考層次從「撰寫角色劇本」提升到「設計協作架構」。一個更具潛力的方向，是將複雜的協作流程拆解成可重用、可組合、可驗證的「原語」（Primitives），建立一個更穩固的底層基礎。

為什麼手寫角色 Prompt 不是長久之計？

像是 ChatDev 或 MetaGPT 這類專案，透過為 CEO、工程師、測試人員等角色定義詳盡的 Prompt，成功模擬了一個軟體開發團隊的運作流程。這些展示很有啟發性，也證明了大型語言模型（LLM）具備角色扮演與執行複雜任務的能力。然而，當我們嘗試將這種模式應用到更廣泛、更動態的真實世界問題時，其脆弱性便顯而易見。

手寫 Prompt 的核心問題在於它的「隱性」與「脆弱」。系統的行為高度依賴 Prompt 的細微措辭，微小的調整就可能導致完全不同的結果，使其難以預測與除錯。

此外，這種方法也缺乏通用性——為軟體開發設計的 Agent 角色，無法輕易地遷移到學術研究或市場分析等其他領域，每次都需要重新設計一套全新的角色與互動規則。這使得系統的擴展與維護成本極高，離真正的工程化與產品化還有很長一段距離。

當我們把所有複雜性都塞進一個巨大的 Prompt 黑盒子時，我們失去的是對系統行為的可控性、可驗證性與可組合性。

Agent Primitives 如何解決這個問題？

一篇發表於 2026 年 2 月 3 日的論文《Agent Primitives: Reusable Latent Building Blocks for Multi-Agent Systems》，提出了一個極具洞見的解決方案。研究者主張，我們應該將 Agent 之間複雜的協作行為，分解為一組更小、更基礎的「原語」。這些原語就像是程式語言中的函式庫或是樂高積木，是構成所有複雜互動的最小單位。

這篇研究將多樣的協作模式歸納為三大核心原語：

Review (審查)：一個 Agent 評估另一個 Agent 產出的能力，提供回饋或修正建議。
Voting (投票)：多個 Agent 針對一個提案或選項進行表決，以達成共識。
Planning (規劃)：一個或多個 Agent 將複雜目標分解為一系列可執行的子任務。

透過將這些原語模組化，開發者可以像組合函式一樣，彈性地建構出各種複雜的協作流程，而無需從頭撰寫冗長的 Prompt。更關鍵的是，這篇論文提出讓這些原語在模型的「潛在空間」（Latent Space）中直接溝通，例如透過 KV Cache 進行內部資訊交換。這不僅大幅提升了效率，也減少了在自然語言轉換過程中可能發生的資訊損失與歧義，讓 Agent 之間的協作更精確、更可靠。

這對我們建構 AI 系統有什麼啟示？

「Agent Primitives」這個概念，為多 Agent 系統的工程實踐帶來了重要的啟示。它標誌著一種思維轉變：從「Prompt 藝術家」轉向「系統架構師」。我們的重點不再是雕琢完美的角色描述，而是設計穩固的互動協議與可重用的功能模組。

這種模組化、結構化的思維，其實已經在一些前沿的開發框架中看到雛形。

例如，LangGraph 就引入了「圖」的概念來定義 Agent 的狀態與轉換，這本質上就是一種將協作流程明確化、結構化的嘗試。業界如 Anthropic 也在探索更系統化的多 Agent 研究框架，而 OpenAI 的 Cookbook 也開始討論如何有效地「編排」（Orchestrating）多個 Agent。這些都指向同一個未來：要讓多 Agent 系統真正落地，我們必須超越 Prompt 的表層，深入到底層的互動結構。

將協作行為拆解為原語，不僅能提升系統的穩定性與通用性，更重要的是它讓「驗證」成為可能。我們可以針對單一的 Review 或 Voting 原語進行單元測試，確保其行為符合預期，這在傳統的手寫 Prompt 模式下幾乎是不可能的。當我們能對系統的最小單位進行驗證，我們才真正有信心去建構更大型、更複雜、更可靠的 AI 系統。

總結來說，多 Agent 系統的未來，不會只停留在模擬各種社會角色的趣味實驗。真正的突破將來自於我們能否發展出一套標準化的協作原語與架構，讓開發者能以工程化的方式，穩定、高效地建構出能解決實際問題的複雜 AI 系統。這條路才剛開始，但方向已經非常清晰。

延伸閱讀

我是江中喬，專注於 AI Agent Architecture、Memory Governance 與 Cognitive Diversity，持續研究如何打造能夠長期協作、可信任且可治理的 AI 系統。

為什麼手寫角色 Prompt 不是長久之計？

Agent Primitives 如何解決這個問題？

這對我們建構 AI 系統有什麼啟示？

延伸閱讀

Sign up for more like this.