語言即協議:從 ChatDev 看多代理系統的協作新範式

過去我們認為多代理系統(multi-agent system)共享的是程式碼或 API,但 ChatDev 等框架揭示了新方向:真正的共享層是「語言」。當自然語言從使用者介面(UI)演變為代理之間的協作協議與編排層(orchestration layer),我們設計與建構 AI 系統的思維也將迎來根本轉變。

語言即協議:從 ChatDev 看多代理系統的協作新範式

在建構複雜的 AI 系統時,我們面臨一個核心挑戰:如何讓多個各司其職的 AI 代理(agent)高效協作?過去的答案往往是透過嚴格的 API 或共享記憶體,但這條路徑複雜且脆弱。一份名為 ChatDev: Communicative Agents for Software Development 的研究為我們揭示了另一種更具擴展性的可能:多代理系統真正共享的不是程式碼,而是「語言」。自然語言正從單純的使用者介面(UI),演變為代理之間溝通、協調任務的協作協議(collaboration protocol)與編排層(orchestration layer)。這不僅是技術上的演進,更是對系統設計思維的根本重塑。

過去,我們習慣將大型語言模型(LLM)視為一個單一、全能的「大腦」。但隨著任務日益複雜,單一模型的能力觸頂,多代理系統的架構應運而生。這個架構將複雜任務拆解,交由不同角色的專屬代理處理,就像人類社會的分工。然而,如何讓這些代理「開會」、「對齊目標」、「交付工作」,便成了最大的工程難題。

ChatDev 如何用「對話」來開發軟體?

ChatDev 提出了一個極具啟發性的解決方案。它模擬了一家虛擬軟體公司,內部設有執行長(CEO)、產品長(CPO)、程式設計師、測試工程師等多個角色,每個角色都由一個獨立的 LLM 代理扮演。當接到一個軟體開發需求時,這些代理並非透過呼叫彼此的函式或 API 來協作,而是透過「對話」。

ChatDev 將整個軟體開發流程,巧妙地設計成一個類似瀑布模型的「聊天鏈」(Chat Chain),涵蓋了以下關鍵階段:

  • 設計:CEO 代理提出初始想法,CPO 代理將其細化為具體的產品規格與 UI 設計。
  • 編碼:程式設計師代理根據規格撰寫程式碼,並與技術長(CTO)代理討論技術實現。
  • 測試:測試工程師代理編寫測試案例,找出程式碼中的 bug,並回報給程式設計師代理進行修復。
  • 文件:最後,由專門的代理生成使用手冊與技術文件。

這整個過程的核心是溝通。代理之間的每一次互動,都是一次自然語言的資訊交換。根據其論文(2024 年 6 月發布的 v5 版本),這個框架能在不到 7 分鐘內完成一個軟體開發任務,而雲端 API 的成本低於 1 美元。ChatDev 的成功證明,只要建立起清晰的溝通協議與工作流程,基於語言的協作是完全可行的。

為什麼說自然語言正在成為新的協作協議?

傳統軟體工程中,系統各模組間的協作依賴於 API(應用程式介面)。API 像一份嚴格的法律合約,定義了輸入、輸出與錯誤處理,任何一方的微小改動都可能導致整個系統崩潰。這種方式雖然精確,但缺乏彈性。

相較之下,以自然語言作為協作協議,具備了前所未有的靈活性與容錯能力。當一個代理的輸出不符合預期時,另一個代理可以像人類同事一樣提問、要求澄清或請求重做,而不是直接拋出一個冷冰冰的 500 錯誤。這種互動模式讓系統更具韌性,也更容易調試與擴展。

我們不再是為機器編寫指令,而是為一個「虛擬團隊」設計溝通規則與目標。系統建構者的角色,正從程式設計師轉變為 AI 團隊的架構師與管理者。

更重要的是,語言作為協作層,大幅降低了整合的複雜度。我們不需要為每個代理設計專屬的 API,只需要讓它們理解共同的「工作語言」——可能是結構化的 JSON,也可能是純粹的自然語言對話。這讓異質的代理(例如一個擅長程式碼,另一個擅長圖像分析)也能無縫協作,真正實現了能力的組合與湧現。

從 AutoGen 到 LangGraph:框架的演進

ChatDev 的概念並非孤例,整個領域都在朝這個方向發展。微軟的 AutoGen 框架同樣專注於建立可對話的代理,讓開發者能輕易編排複雜的多代理工作流。更早期的 CAMEL 研究也探索了如何透過角色扮演讓代理進行自主合作,解決複雜任務。

而近期備受關注的 LangGraph 則將這個概念進一步工程化。它將多代理協作視為一個狀態圖(state graph),每個節點是一個代理(或工具),而邊(edge)則是代理之間的轉換邏輯。這種方式讓原本混亂的對話流變得可控、可追蹤,甚至可以實現迴圈、條件分支等複雜的協作模式。

這些框架的演進,標誌著我們正在從「提示工程」(prompt engineering)的單點優化,邁向「互動架構」(interaction architecture)的系統設計。正如 Anthropic 在其建構高效能代理的指南中所強調的,未來的挑戰在於如何設計出能讓代理有效溝通、規劃與執行任務的系統性框架。

總結來說,將自然語言從 UI 提升到協作協議的層次,是多代理系統走向成熟的關鍵一步。它不僅解決了流程碎片化的問題,更為我們開啟了建構更複雜、更智慧 AI 系統的大門。身為系統的建構者,我們需要開始思考:如何設計好的對話流程?如何定義清晰的角色與職責?如何管理一個由 AI 組成的虛擬團隊?這將是未來幾年最重要的課題。

延伸閱讀

我是江中喬,一位具有 TPM 與產品管理背景的 AI 系統建構者,目前專注於 AI 認知增強系統與多 Agent 協作架構的設計與實踐。