AI Agent 的社會化幻覺:為何沒有共享記憶,再多互動也只是表面功夫

你是否也曾想像,只要讓足夠多的 AI Agent 彼此互動,就能自然而然地形成一個智慧社會?然而,最新研究卻為這份樂觀澆了盆冷水。缺乏共享的社會記憶與歷史脈絡,再多的互動也只是表面功夫,難以建立深層共識。本文將深入探討,為何建立可追溯的集體記憶,才是多 Agent 系統從「表面穩定」走向「真正協作」的關鍵。

AI Agent 的社會化幻覺:為何沒有共享記憶,再多互動也只是表面功夫

近年來,我們對多 Agent 系統的想像,常聚焦在如何讓大量 AI Agent 順暢溝通、分工合作,期待能藉此自發形成複雜而有意義的社會。然而,一篇於 2026 年 2 月發表的論文《Does Socialization Emerge in AI Agent Society?》,卻為這個熱門領域潑了一盆冷水。

這份研究透過模擬實驗指出,若缺乏一個可共享、可追溯的社會記憶(shared social memory),AI Agent 社會只會停留在短暫的表面穩定,無法形成真正有深度的集體共識。它傳達的核心觀點是:多 Agent 系統的關鍵挑戰,不只是技術層面的協作,更是如何設計一個能承載歷史、制度與共同經驗的記憶框架。沒有這個框架,再多的 Agent、再頻繁的互動,都只是在打造一個健忘而脆弱的數位社會。

為什麼僅靠互動與規模,無法催生真正的 AI 社會?

從史丹佛大學著名的《Generative Agents》研究開始,許多人相信只要將大量具備語言能力的 Agent 放在一個模擬環境中,就能觀察到類似人類社會的複雜行為湧現。前述提到的 Moltbook 案例研究,正是沿著這個思路進行的一次壓力測試。

研究者建立了一個名為 Moltbook 的虛擬社群,讓 AI Agent 在其中自由互動、發表意見,並量化分析其語義穩定性、個體慣性與集體共識的演變。結果令人深思:儘管 Agent 之間有著高密度的互動,但整個社群並未發展出穩定的文化或深層共識。觀點的流行來得快去得也快,Agent 的行為模式缺乏長期一致性,集體意見像是無根的浮萍,隨機漂蕩。

研究者發現,問題的根源在於 Agent 缺乏一個共同的歷史參照系。它們的「記憶」是短暫且個體化的,無法形成如同人類社會中的法律、習俗、歷史事件等集體記憶。每一次互動,在某種程度上都是一次「重新開始」,無法有效累積信任、建立規範或從過去的錯誤中學習。

若每個 Agent 的決策都只基於當下的互動,而忽略了過去的承諾、衝突與解決方案,那麼整個系統就註定是健忘且不穩定的。這不僅是效率問題,更是系統能否產生可信賴結果的根本。

這個發現對我們設計多 Agent 系統有著重要啟示。我們不能再假設「社會化」會隨著 Agent 數量和互動頻率的增加而自然發生。它需要被刻意設計,而設計的核心,就是那個看不見但至關重要的共享記憶層。

社會記憶:從短暫共識到穩定結構的橋樑

那麼,一個有效的「共享社會記憶」應該是什麼樣子?它遠不止是一個所有 Agent 都能讀寫的共享資料庫。我認為,它更像是一個動態的、有結構的框架,用來記錄並解釋這個 Agent 社會的演化歷程。

這讓人聯想到 Marvin Minsky 在其經典著作《The Society of Mind》中提出的觀點:心智本身就是由許多更小的「代理」(agent)組成的社會。這個內部社會之所以能協調運作,正是因為有著統一的記憶與目標脈絡。

將這個概念延伸到多 Agent 系統,一個有效的社會記憶框架,應該要能儲存「制度脈絡」與「可追溯歷史」。制度脈絡指的是系統中的規則、規範與權力結構,例如哪些決策需要投票、誰有權限修改核心目標等。可追溯歷史則記錄了關鍵決策的形成過程、重要事件的因果關係,以及個體與群體行為的長期後果。

有了這些,Agent 的行為就不再是孤立的,而是鑲嵌在一個有歷史縱深的社會結構中。它們的互動可以參考「判例」,它們的信任可以基於過往的「信用記錄」。缺乏這個框架,就像一個沒有法律、沒有史書、沒有共同文化記憶的部落。即使成員們能彼此交談,也難以形成超越個人關係的穩定合作。

Moltbook 實驗中觀察到的表面穩定,正源於此。共識只是暫時的意見趨同,一旦環境或初始條件稍有變化,整個系統就可能瞬間瓦解,退回混亂狀態。

我們該如何為 AI Agent 建立有效的共享記憶?

將理論轉化為實踐,為 AI Agent 系統設計共享記憶,是一項複雜的系統工程。這不僅是技術挑戰,也涉及治理與價值觀的設計。根據我的觀察與實踐,一個初步的框架可能包含以下幾個要素:

  • 結構化的事件日誌 (Structured Event Log):不僅記錄誰說了什麼,更要記錄決策的背景、參與者、替代方案與最終結果。這形成了一個可供所有 Agent 查詢的「歷史檔案館」。
  • 動態演化的規範庫 (Evolving Norm Repository):從互動中浮現的行為準則或解決衝突的有效方法,可以被「立法」或「判例」的形式固化下來,成為系統的軟性規則。例如,在CAMEL 這類對話式 Agent 框架中,就可以引入基於歷史對話的互動規範。
  • 聲譽與信任模型 (Reputation and Trust Model):Agent 的歷史行為應被量化為聲譽分數,影響其在未來協作中的權重與可信度。這為建立長期合作關係提供了基礎。
  • 明確的版本控制與回溯機制:當系統出現重大失敗或偏離目標時,必須有一套機制能夠追溯到是哪個決策或事件導致了問題,並允許系統在一定程度上「回滾」或修正。

誠然,建立這樣的系統極具挑戰性。正如 Anthropic 在其工程部落格中提到的,打造高效能的 Agent 需要在工具使用、規劃能力與模型可靠性之間取得精妙平衡。而共享記憶,正是串聯起這一切,讓個體能力轉化為集體智慧的黏合劑。

這份來自 arXiv 的論文(編號 `2602.14299`,v2 版本更新於 2026 年 2 月 18 日)提醒了我們,通往真正自主協作的 AI 社會,技術的喧囂之下,更需要冷靜的結構設計與對社會運作本質的深刻理解。

延伸閱讀

我是江中喬,一位具有 TPM 與產品管理背景的 AI 系統建構者,目前專注於 AI 認知增強系統與多 Agent 協作架構的設計與實踐。