mk-brain

AI Agent 的成敗關鍵，不在模型智商，而在駕馭它的基礎設施

我們常陷入追求更強大模型的迷思，但 AI Agent 要真正落地，關鍵不在於模型本身有多聰明，而在於我們如何為這匹脫韁野馬套上馬具。這套「馬具」，就是決定成敗的基礎設施，它將機率性的 AI 轉化為企業可控、可信賴的系統。

江中喬

25 4月 2026 • 6 min read

過去一年，我們見證了大型語言模型（LLM）能力的飛躍，從 GPT-4 到 Claude 3，再到 Llama 3，模型的「智商」不斷刷新紀錄。這股浪潮也點燃了對 AI Agent（AI 代理）的無限想像——一個能自主理解、規劃、執行複雜任務的數位員工。然而，當我們嘗試將這些聰明的模型直接投入真實工作場景時，卻往往發現它們像一匹難以駕馭的野馬，充滿潛力，卻也充滿不確定性。

我認為，業界將在未來一兩年內形成一個重要共識：AI Agent 能否成功的關鍵，早已不純然是模型本身的能力競賽。更重要的，是我們為模型打造的「馬具」（Harness）——也就是那一整套能將其機率性輸出轉化為穩定、可控結果的基礎設施架構。

這就是我認為在 2026 年前會被驗證的黃金公式：Agent = Model + Harness。

為何單純的模型不足以成為 Agent？

一個未經束縛的 LLM，本質上是一個「統計文字產生器」。它根據龐大的數據訓練，學會了預測下一個最有可能出現的詞彙。這讓它在對話、寫作等任務上表現驚人，但這種機率驅動的特性，也為其在實際應用中帶來了幾個核心挑戰：

不可靠性（Unreliability）：同樣的指令，模型可能產生不同的結果，甚至出現「幻覺」（Hallucination），捏造事實。在需要精確執行的商業流程中，這是無法接受的。
缺乏狀態記憶（Statelessness）：模型本身沒有長期記憶。如果沒有外部系統輔助，它無法記得過去的互動、學習經驗，或是在多步驟任務中維持一致的上下文。
有限的行動能力（Limited Actionability）：模型本身無法直接操作外部世界，例如讀取資料庫、發送電子郵件或呼叫 API。它需要一個安全的橋樑來與其他系統互動。

這些限制說明了，光有聰明的大腦還不夠。一個真正的 Agent 需要一個健全的「身體」與「行為準則」，讓它的智慧能穩定地發揮作用。這就是 Harness 存在的意義。

解構「馬具」：駕馭 AI 的五大基礎設施層

這個所謂的「馬具」並非單一工具，而是一個由多層次基礎設施構成的複雜系統。它的核心目標，是為模型的不確定性加上約束，將其行為導向我們期望的結果。這套系統的設計，正是將 AI 從單純的智慧引擎，轉化為企業級應用的關鍵。一個能夠在真實世界運作的 Agent 系統，通常包含以下五個關鍵層次：

執行層（Execution Layer）：這是 Agent 的「中央神經系統」。它負責接收任務、將複雜目標分解為可執行的小步驟、規劃行動順序，並調度工具來完成任務。這一層確保了 Agent 的行動是有計畫、有邏輯的，而不是隨機的。
狀態層（State Layer）：這是 Agent 的「記憶中心」。它管理著 Agent 的短期記憶（如當前任務進度）與長期記憶（如使用者偏好、過去的成功經驗）。有了狀態層，Agent 才能在長時間的互動中保持連貫性，並從經驗中學習與演進。
能力層（Capability Layer）：這是 Agent 的「工具箱」。它定義並封裝了 Agent 可以使用的所有技能，例如讀取檔案、搜尋網路、操作客戶關係管理系統（CRM）等。這一層不僅提供工具，更重要的是管理工具的使用權限與正確用法，避免 Agent 誤用或濫用。
治理層（Governance Layer）：這是 Agent 的「監督者與防火牆」。在企業環境中，這一層至關重要。它負責處理權限控管、操作紀錄（logging）、成本追蹤、安全檢查與合規性。治理層確保 Agent 的所有行為都在可控、可稽核的範圍內，避免它做出越權或有風險的舉動，是建立企業信任的基石。
適配器層（Adapter Layer）：這是 Agent 與「外部世界溝通的橋樑」。它負責將 Agent 的內部指令轉化為對外部 API、資料庫或使用者介面的實際操作，並將外部系統的回饋轉化為 Agent 能理解的格式。這一層讓 Agent 能夠無縫地融入現有的工作流程與技術堆疊。

AI Agent 的未來，取決於我們能否將一個充滿不確定性的機率模型，透過嚴謹的工程與架構，轉化為一個穩定、可靠、可信任的系統元件。

從機率到可控：系統設計思維的轉變

理解了這套 Harness 架構後，我們看待 AI Agent 的視角也應該從「模型訓練」轉向「系統建構」。這意味著，打造 Agent 的團隊，其挑戰不再只是機器學習問題，而更多是分散式系統、軟體架構與營運治理的工程問題。

過去，我們問的是：「哪個模型的表現更好？」未來，我們更應該問：「哪個系統架構能更好地管理模型的風險，並穩定地創造價值？」

當我們在評估或導入一個 AI Agent 方案時，不應只看它底層用了哪個模型，而應該深入檢視它的 Harness 設計是否健全。它如何處理錯誤？如何保障資料安全？它的行為可追溯嗎？成本可控嗎？這些問題的答案，遠比模型在某個評測指標上高出幾個百分點來得重要。

最終，能夠大規模進入工作現場的，不會是那些擁有最高智商、卻行為難測的「天才」，而是那些在強大基礎設施支持下，表現穩定、值得信賴的「專業人士」。這場關於 AI Agent 的競賽，最終的贏家將是那些最懂得如何打造與駕馭「馬具」的系統建構者。

AI Agent 的成敗關鍵，不在模型智商，而在駕馭它的基礎設施

江中喬

為何單純的模型不足以成為 Agent？

解構「馬具」：駕馭 AI 的五大基礎設施層

從機率到可控：系統設計思維的轉變

延伸閱讀

Sign up for more like this.