mk-brain

把 LLM 當 CPU：Context Pointer OS 如何為自主 Agent 打造認知作業系統

AI Agent 發展停滯不前？關鍵在於 LLM 的「記憶力」不足。一篇日本開發者的創新論文提出 CPOS 概念，將 LLM 視為 CPU，並為其打造一套作業系統級的記憶體管理機制。這套架構透過智慧調度「工作記憶」與「長期記憶」，為 Agent 實現真正的長期記憶與自主決策能力，描繪了一條清晰可行的未來路徑。

江中喬

17 6月 2026 • 6 min read

當前 AI Agent 的發展瓶頸，很大程度來自大型語言模型（LLM）有限的上下文視窗（context window）與無狀態（stateless）的本質。這導致 Agent 難以處理需長時間執行的複雜任務，也無法有效累積與利用經驗。為了解決這個問題，業界的主流作法是暴力擴展上下文長度，但這終究有其極限。我認為，一個更根本的架構轉向正在發生：將 LLM 視為一個純粹的「中央處理器」（CPU），並在其上建立一個更高層次的「作業系統」（OS）來負責記憶體與任務調度。這不僅是個比喻，而是一個通往真正自主 Agent 的關鍵路徑。

當前 AI Agent 為何難以實現真正的「自主」？

目前多數 Agent 的運作模式，是將所有相關資訊——包括系統提示、歷史對話、工具定義、外部文件——全部塞進模型的上下文視窗裡。這就像一台只有少量 RAM 的電腦，所有程式與資料都必須擠在裡面。一旦任務所需資訊超過上下文的容量上限，Agent 就會開始「遺忘」，失去對話的脈絡、忘記先前的指令，或是無法整合長篇文件中的知識。

雖然像 Google Gemini 1.5 Pro 這樣的新模型，已經將上下文長度擴展到 100 萬個 token，暫時緩解了問題，但這更像是一種硬體升級，而非架構上的根本解決方案。只要任務的複雜度與時間跨度持續增加，我們終究會再次撞上記憶體的高牆。更重要的是，這種將所有資訊一視同仁塞入提示詞的作法，缺乏效率與彈性，也無法區分「當前需要專注的工作記憶」與「備而不用的長期記憶」。真正的自主性，需要的是更精巧的資源管理機制。

把 LLM 當 CPU：CPOS 如何重新定義記憶體管理？

最近一篇由日本開發者提出的《Context Pointer OS (CPOS)》概念性論文，為這個問題提供了一個極具啟發性的架構。CPOS 的核心思想，是徹底將 LLM 的角色從一個無所不包的資訊容器，轉變為一個專注於推理與執行的「CPU」。而傳統上被視為 LLM 輸入的提示詞（prompt）區域，則被重新定義為動態管理的「工作記憶體」（Working Memory / RAM）。

這個架構借鑒了現代電腦作業系統的虛擬記憶體管理機制。CPOS 會將大量的外部知識與對話歷史儲存在向量資料庫等「長期記憶體」（Long-term Memory / Storage）中。當 Agent 需要執行特定任務時，CPOS 這個「作業系統」會像記憶體管理器一樣，只將當下最相關的資訊片段（稱為 Context Pointers）載入到 LLM 的「工作記憶體」中。這確保了 LLM 的每一步推理，都是在最精簡、最相關的資訊基礎上進行，大幅提升了效率與可擴展性。

這個想法與加州大學柏克萊分校提出的 MemGPT 概念不謀而合。MemGPT 同樣將 LLM 視為一個受限的處理單元，並透過一個虛擬上下文管理器，在主記憶體（LLM 上下文）與外部儲存之間進行數據分頁（paging），讓 Agent 能夠處理超越其上下文長度的資訊流。

這種分層架構，也更貼近人類的認知模式。根據心理學家 Baddeley 的工作記憶模型，人類的意識同樣有一個容量有限的「工作記憶」區域，用來處理當前的感知與思考，同時能從龐大的長期記憶中提取所需資訊。CPOS 正是試圖在 AI Agent 中模擬這種高效的認知分工。

從基礎到自律：CPOS 的三階段發展路徑

CPOS 的論文不僅提出了概念，更規劃了一條清晰的三階段實踐路徑，從一個基礎的記憶體管理器，逐步演化為一個完全自主的認知系統。

第一階段：核心實作層 (Core Implemented Layer)
這是 CPOS 目前已初步實現的基礎。它包含了記憶體管理的核心功能，能夠定義主上下文（Main Context）與子上下文（Sub Context），並透過 Context Pointers 從外部儲存中動態載入資訊。這一層的目標是解決 LLM 的記憶體限制問題，讓 Agent 具備處理長篇文件與長期對話的能力。

第二階段：認知執行層 (Cognitive Runtime Layer)
在記憶體管理的基礎上，這一層引入了更多作業系統的核心元件。例如，一個「排程器」（Scheduler）用來管理多個並行任務的執行順序；一個「程序管理器」（Process Manager）負責監督子任務的生命週期；以及一個「中斷處理器」（Interrupt Handler）來應對外部世界的突發事件。這讓 Agent 從一個單純的問答機器，演變成一個能同時處理多個目標的任務執行平台。

第三階段：自律認知系統 (Autonomous Cognitive System)
這是 CPOS 的最終願景。當 Agent 擁有了成熟的記憶體與程序管理能力後，它將能發展出更高層次的自主性。例如，系統可以根據執行結果自我反思、動態調整長期目標、甚至主動優化自身的運作策略。在這個階段，CPOS 不再只是一個被動的執行環境，而是一個能夠自我演化、具備元認知（metacognition）能力的智慧體。

這個從記憶體管理到任務調度，再到自我導向的演化路徑，為我們描繪了一幅從今天的「工具型 Agent」邁向未來「夥伴型 Agent」的藍圖。將 LLM 的強大推理能力與作業系統的成熟管理哲學相結合，或許正是釋放 AI Agent 全部潛力的關鍵。這不僅是技術上的演進，更是一種思維框架的轉變——我們不再試圖打造一個更大的「大腦」，而是為這個「大腦」設計一個更聰明的「神經系統」。

把 LLM 當 CPU：Context Pointer OS 如何為自主 Agent 打造認知作業系統

江中喬

當前 AI Agent 為何難以實現真正的「自主」？

把 LLM 當 CPU：CPOS 如何重新定義記憶體管理？

從基礎到自律：CPOS 的三階段發展路徑

延伸閱讀

Sign up for more like this.