多 Agent 系統的下一步:告別脆弱工作流,擁抱形式化共識

當前的多 Agent 系統多半依賴靜態、線性的工作流,這不僅效率低落,也難以保證結果的可靠性。本文探討為何將分散式系統中的「形式化共識協議」引入 Agent 協作,才是實現規模化、可信賴推理的關鍵一步。

多 Agent 系統的下一步:告別脆弱工作流,擁抱形式化共識

目前主流的多 Agent 系統,無論是基於對話的 AutoGen 或是角色扮演的 CAMEL 框架,許多人可能都曾有過一個誤解:以為單純堆疊更多 Agent 角色、設計更精巧的流程,就能解決更複雜的問題。但我認為,這條路很快就會遇到瓶頸。要讓多 Agent 協作真正規模化、變得可靠,關鍵並非流程的複雜度,而是能否將協作過程,轉化為一種能被分析、驗證且最終收斂的「形式化共識協議」。這不僅關乎效率,更是決定系統能否在關鍵任務中值得信賴的根本所在。

為什麼現行的多 Agent 工作流會遇到瓶頸?

當前許多多 Agent 應用的設計,本質上,都像是一場靜態的「接力賽」或「生產線」。一個 Agent 完成它的任務,然後將結果傳遞給下一個。這種線性、固定的工作流(static workflow)看似簡單直觀,卻隱藏著幾個本質上的限制,阻礙了其規模化與可靠性:

  • 脆弱性(Brittleness):整個系統的成敗,往往取決於鏈條中最脆弱的一環。只要其中一個 Agent 的推理出現偏差或效率低下,整個流程就會被污染、拖延,甚至難以修正。
  • 長尾延遲(Long-tail Latency):系統的總耗時,總是受制於最慢的那個 Agent。在複雜任務中,我們無法預測哪個環節會成為瓶頸,這導致整體延遲極不穩定,難以在生產環境中提供可靠的服務水準協議(SLA)。
  • 缺乏可驗證性:當最終結果出爐時,我們很難追溯其達成路徑,也難以驗證其可靠性。整個過程像一個黑盒子,我們只能寄望它「剛好」正確,卻無法從根本機制上保證其可靠性。

自從 CAMEL 在 2023 年 3 月提出角色扮演框架,到同年 8 月 AutoGen 推出可對話的 Agent 模式,我們確實看到了許多流程設計上的創新。但這些創新多半仍停留在「編排」層次,而非更底層的「協定」層次。若要建構真正穩健、可靠的系統,我們需要從更根本的結構中尋找答案。

從分散式系統借鏡:什麼是「形式化共識」?

答案,或許就在一個已經發展數十載、相當成熟的領域:分散式系統。數十年來,工程師們一直在解決一個核心難題:如何讓一群可能出錯、可能延遲的獨立電腦(節點),共同對某件事達成一致且不可動搖的決定。為此,他們發展出了一系列的形式化共識協議(Formal Consensus Protocol),例如經典的 Paxos 或 Raft。

共識協議的核心目標,是在一群可能出錯的參與者(節點)之間,針對某個值達成唯一、不可撤銷的決定。

這個概念,與多 Agent 推理的需求可謂不謀而合。我們可以將每一個 LLM Agent 視為一個獨立但可能不可靠的「推理節點」。我們的目標,就是讓這群 Agent 針對一個複雜問題的答案,達成一個可靠的共識,而不是盲目地聽從生產線上最後一個 Agent 的單一輸出。

如何將共識協議應用於 LLM Agent 推理?

最近一篇名為《Reaching Agreement Among Reasoning LLM Agents》的研究,便朝這個方向邁出了關鍵一步。該研究提出了一種名為 Aegean 的協議與服務引擎,其核心思想,便是「增量法定人數檢測」(Incremental Quorum Detection)。

傳統工作流往往是等待所有 Agent 完成任務,或由某個固定的 Agent 回報結果。而 Aegean 的做法則截然不同:

  1. 系統同時啟動多個獨立的 Agent,讓它們針對同一個問題並行處理。
  2. 系統會持續監測所有 Agent 的中間與最終答案。
  3. 一旦收集到足夠數量的 Agent(即達到「法定人數」或 Quorum),並對同一個答案達成共識,系統便會立刻採納該答案並終止整個流程,無需等待其餘仍在運算的慢速 Agent。

例如,在一個由 5 位 Agent 組成的系統中,協議可能設定為「只要其中 3 位 Agent 達成共識,即可輸出結果」。這種做法,帶來了顯而易見的諸多好處:

  • 顯著降低延遲:系統的反應時間取決於最快達成共識的那批 Agent,而不是最慢的那一個,有效消除了傳統工作流中的長尾延遲。
  • 提升結果可靠性:最終答案是由多個 Agent「交叉驗證」後達成的共識,而非單一 Agent 的獨斷輸出,大幅降低了產生「幻覺」或錯誤結論的風險。
  • 可分析與可擴展:由於共識過程是形式化的,我們得以精確分析其可靠性,並能彈性設定不同的共識閾值(例如要求 5 位中有 4 位同意),甚至透過增加 Agent 數量來進一步增強系統的穩健性。

該研究在數學推理基準測試中的實驗表明,這種方法能夠在維持甚至提升回答品質的前提下,顯著降低端到端的延遲。

總結來說,多 Agent 系統的未來,或許不在於設計更華麗的 Agent 互動劇本,而更應回歸到更底層、更堅實的協作協議。將分散式系統中經過數十年千錘百鍊的共識機制引入 AI 協作,這不僅能有效解決當前工作流的效率與可靠性問題,更為建構真正可信賴、可規模化的認知系統,指明了一條清晰且充滿潛力的道路。

延伸閱讀

我是江中喬,一位具有 TPM 與產品管理背景的 AI 系統建構者,目前專注於 AI 認知增強系統與多 Agent 協作架構的設計與實踐。