mk-brain

語言即協議：從 ChatDev 看多代理系統的協作新範式

過去我們認為多代理系統（multi-agent system）共享的是程式碼或 API，但 ChatDev 等框架揭示了新方向：真正的共享層是「語言」。當自然語言從使用者介面（UI）演變為代理之間的協作協議與編排層（orchestration layer），我們設計與建構 AI 系統的思維也將迎來根本轉變。

江中喬

14 5月 2026 • 6 min read

在建構複雜的 AI 系統時，我們面臨一個核心挑戰：如何讓多個各司其職的 AI 代理（agent）高效協作？過去的答案往往是透過嚴格的 API 或共享記憶體，但這條路徑複雜且脆弱。一份名為 ChatDev: Communicative Agents for Software Development 的研究為我們揭示了另一種更具擴展性的可能：多代理系統真正共享的不是程式碼，而是「語言」。自然語言正從單純的使用者介面（UI），演變為代理之間溝通、協調任務的協作協議（collaboration protocol）與編排層（orchestration layer）。這不僅是技術上的演進，更是對系統設計思維的根本重塑。

過去，我們習慣將大型語言模型（LLM）視為一個單一、全能的「大腦」。但隨著任務日益複雜，單一模型的能力觸頂，多代理系統的架構應運而生。這個架構將複雜任務拆解，交由不同角色的專屬代理處理，就像人類社會的分工。然而，如何讓這些代理「開會」、「對齊目標」、「交付工作」，便成了最大的工程難題。

ChatDev 如何用「對話」來開發軟體？

ChatDev 提出了一個極具啟發性的解決方案。它模擬了一家虛擬軟體公司，內部設有執行長（CEO）、產品長（CPO）、程式設計師、測試工程師等多個角色，每個角色都由一個獨立的 LLM 代理扮演。當接到一個軟體開發需求時，這些代理並非透過呼叫彼此的函式或 API 來協作，而是透過「對話」。

ChatDev 將整個軟體開發流程，巧妙地設計成一個類似瀑布模型的「聊天鏈」（Chat Chain），涵蓋了以下關鍵階段：

設計：CEO 代理提出初始想法，CPO 代理將其細化為具體的產品規格與 UI 設計。
編碼：程式設計師代理根據規格撰寫程式碼，並與技術長（CTO）代理討論技術實現。
測試：測試工程師代理編寫測試案例，找出程式碼中的 bug，並回報給程式設計師代理進行修復。
文件：最後，由專門的代理生成使用手冊與技術文件。

這整個過程的核心是溝通。代理之間的每一次互動，都是一次自然語言的資訊交換。根據其論文（2024 年 6 月發布的 v5 版本），這個框架能在不到 7 分鐘內完成一個軟體開發任務，而雲端 API 的成本低於 1 美元。ChatDev 的成功證明，只要建立起清晰的溝通協議與工作流程，基於語言的協作是完全可行的。

為什麼說自然語言正在成為新的協作協議？

傳統軟體工程中，系統各模組間的協作依賴於 API（應用程式介面）。API 像一份嚴格的法律合約，定義了輸入、輸出與錯誤處理，任何一方的微小改動都可能導致整個系統崩潰。這種方式雖然精確，但缺乏彈性。

相較之下，以自然語言作為協作協議，具備了前所未有的靈活性與容錯能力。當一個代理的輸出不符合預期時，另一個代理可以像人類同事一樣提問、要求澄清或請求重做，而不是直接拋出一個冷冰冰的 500 錯誤。這種互動模式讓系統更具韌性，也更容易調試與擴展。

我們不再是為機器編寫指令，而是為一個「虛擬團隊」設計溝通規則與目標。系統建構者的角色，正從程式設計師轉變為 AI 團隊的架構師與管理者。

更重要的是，語言作為協作層，大幅降低了整合的複雜度。我們不需要為每個代理設計專屬的 API，只需要讓它們理解共同的「工作語言」——可能是結構化的 JSON，也可能是純粹的自然語言對話。這讓異質的代理（例如一個擅長程式碼，另一個擅長圖像分析）也能無縫協作，真正實現了能力的組合與湧現。

從 AutoGen 到 LangGraph：框架的演進

ChatDev 的概念並非孤例，整個領域都在朝這個方向發展。微軟的 AutoGen 框架同樣專注於建立可對話的代理，讓開發者能輕易編排複雜的多代理工作流。更早期的 CAMEL 研究也探索了如何透過角色扮演讓代理進行自主合作，解決複雜任務。

而近期備受關注的 LangGraph 則將這個概念進一步工程化。它將多代理協作視為一個狀態圖（state graph），每個節點是一個代理（或工具），而邊（edge）則是代理之間的轉換邏輯。這種方式讓原本混亂的對話流變得可控、可追蹤，甚至可以實現迴圈、條件分支等複雜的協作模式。

這些框架的演進，標誌著我們正在從「提示工程」（prompt engineering）的單點優化，邁向「互動架構」（interaction architecture）的系統設計。正如 Anthropic 在其建構高效能代理的指南中所強調的，未來的挑戰在於如何設計出能讓代理有效溝通、規劃與執行任務的系統性框架。

總結來說，將自然語言從 UI 提升到協作協議的層次，是多代理系統走向成熟的關鍵一步。它不僅解決了流程碎片化的問題，更為我們開啟了建構更複雜、更智慧 AI 系統的大門。身為系統的建構者，我們需要開始思考：如何設計好的對話流程？如何定義清晰的角色與職責？如何管理一個由 AI 組成的虛擬團隊？這將是未來幾年最重要的課題。

延伸閱讀

我是江中喬，專注於 AI Agent Architecture、Memory Governance 與 Cognitive Diversity，持續研究如何打造能夠長期協作、可信任且可治理的 AI 系統。

ChatDev 如何用「對話」來開發軟體？

為什麼說自然語言正在成為新的協作協議？

從 AutoGen 到 LangGraph：框架的演進

延伸閱讀

Sign up for more like this.