AGI 的最後一塊拼圖:為何「協調層」比更大的模型更重要
我們距離通用人工智慧(AGI)還有多遠?一篇新論文指出,關鍵瓶頸不在於模型大小或資料量,而在於一個被忽略的「協調層」。本文將探討為何這種系統整合思維,而非單純的能力堆疊,才是實現真正目標導向智慧的關鍵,並解釋我們該如何從「模式煉金術」轉向更具結構性的「協調物理學」。
通用人工智慧(AGI)的瓶頸,不在於模型規模或資料量,而是缺乏能約束並引導知識模式的「協調層」。從單純的「模式煉金術」轉向「協調物理學」,建立能將獨立能力整合成目標導向行動的系統,才是通往真正智慧的關鍵一步。
我們是否高估了「規模化」的力量?
過去幾年,大型語言模型(LLM)的發展令人驚嘆。從 GPT-3 到今天的各種巨型模型,參數規模動輒突破兆級,它們在語言生成、知識問答等任務上展現了驚人的能力。這股浪潮讓許多人相信,只要持續擴大模型規模,通用人工智慧(AGI)的曙光就在不遠處。
然而,這種信念也引來了深刻的質疑。學界早有 「隨機鸚鵡」(Stochastic Parrots) 的批判,指出模型只是在模仿訓練資料中的模式,而缺乏真正的理解與意圖。
即使模型能夠儲存幾乎整個網際網路的知識,它們在面對需要多步驟、跨領域推理的複雜問題時,仍然會顯得脆弱且不穩定。它們可能會產生幻覺、在邏輯上自相矛盾,或無法根據明確的目標來規劃和執行一系列連貫的行動。
這顯示出一個根本問題:擁有龐大的模式儲備,與能夠有目的地「使用」這些模式,是兩件截然不同的事。單純的規模化,就像是打造了一座藏書無數的圖書館,卻沒有一位懂得如何查找、整合並應用這些知識的圖書館員。
為什麼單純的模式匹配還不夠?
要理解這個問題,我們可以借鏡諾貝爾獎得主 Daniel Kahneman 提出的「雙系統理論」。人類的認知可以粗略分為兩個系統:
- 系統一(System 1):快速、直覺、自動化的思考,主要依賴經驗與模式匹配。例如,看到 2+2 能立即反應出 4。
- 系統二(System 2):緩慢、需要刻意、有邏輯的思考,用於處理複雜的計算與規劃。例如,計算 27 x 43。
目前的 LLM 在很大程度上是「系統一」的極致展現。它們能在一瞬間從龐大的資料中匹配出最可能的下一個詞元,表現出流暢的對話能力。然而,它們缺乏一個強健的「系統二」來進行監督、驗證與規劃。當任務超出單純的模式匹配範疇,需要目標分解、策略選擇與結果驗證時,LLM 的弱點便暴露無遺。
真正的推理能力,不僅僅是模式的再現,更是對模式的選擇、組合與約束,以服務於一個特定的目標。
這正是許多 AI 研究者開始將目光從模型本身,轉向其外部協調框架的原因。我們需要的不是一個更大的「系統一」,而是一個能夠駕馭它的「系統二」。
「協調層」到底是什麼?
一篇於 2025 年 12 月發表的論文 《The Missing Layer of AGI: From Pattern Alchemy to Coordination Physics》,精準地指出了這個缺失的環節。作者 Edward Y. Chang 提出,AGI 的實現需要一個明確的「協調層」(Coordination Layer)。這個協調層並非模型的一部分,而是一個位於模型之上、負責目標導向推理的系統架構。
這篇論文提出了兩個核心概念:統一認知協調理論(Unified Cognitive Coordination Theory, UCCT)與模組化代理協調基礎設施(Modular Agent Coordination Infrastructure, MACI)。簡而言之,UCCT 提供了理論基礎,定義了如何將高階目標分解為可執行的子任務,並在過程中動態綁定所需的知識模式;而 MACI 則是實現這一理論的工程堆疊。
這個協調層的功能,可以類比為電腦的作業系統,負責以下關鍵任務:
- 目標管理:如同作業系統的行程管理器,負責接收、理解並追蹤高階目標。
- 資源調度:根據當前任務,決定呼叫哪個模型、使用哪種工具(如程式碼直譯器、搜尋引擎)。
- 狀態監控與回饋:持續評估任務進度,將結果回饋給規劃模組,並在必要時進行修正。
在這種架構下,LLM 不再是唯一的智慧核心,而是被協調層當作一個強大的「模式引擎」或「知識庫」來呼叫。這種系統整合的思維,讓我們得以從追求單一模型的「萬能」,轉向設計一個能夠整合多種專用工具與模型的智慧系統,這顯然是一條更具擴展性與可靠性的路徑。
諸如 LangChain 或 AutoGPT 等早期框架,已經展現了這種協調思想的雛形,儘管它們還相對初階。
從「煉金術」到「物理學」的轉變,意味著我們不再寄望於黑箱模型中神秘湧現的智慧,而是開始用系統工程的原則,去設計與建構一個可預測、可除錯、可擴展的智慧體系。這或許不像訓練一個更大的模型那樣激動人心,但它卻是讓 AI 從一個強大的工具,邁向一個可靠的協作者所必需的、更為成熟的途徑。
延伸閱讀
- Chang, E. Y. (2025). The Missing Layer of AGI: From Pattern Alchemy to Coordination Physics. arXiv:2512.05765.
- Bender, E. M., et al. (2021). On the Dangers of Stochastic Parrots: Can Language Models Be Too Big?. FAccT '21.
- Kahneman, D. (2011). Thinking, Fast and Slow. Farrar, Straus and Giroux.
我是江中喬,一位具有 TPM 與產品管理背景的 AI 系統建構者,目前專注於 AI 認知增強系統與多 Agent 協作架構的設計與實踐。