mk-brain

Agent 不是真的失憶，而是多數人從未設計過記憶系統

當 Agent 開始進入真實工作流，問題往往不是模型記不住，而是我們從來沒有替它設計上下文、長期記憶與狀態交接的機制。

江中喬

18 4月 2026 • 7 min read

很多人在把 Agent 真正放進工作流之後，會很快遇到一種熟悉的挫折：

它怎麼又忘了。

上一輪才確認過的規則，下一輪像沒發生過；昨天才講清楚的偏好，今天又得重來一次；任務一切換，整個狀態像重新開機。

多數時候，Agent 並不是真的失憶，而是我們從來沒有替它設計過記憶系統。

這兩種說法看起來只差一點，背後其實是兩種完全不同的思考方向：前者把問題歸因於模型能力，後者把問題拉回系統設計。而我認為，真正值得處理的，通常是後者。

為什麼「記住」從來不是單一功能？

一旦 Agent 走出聊天視窗、進入真實工作流，所謂的記憶就不再只是「把說過的話存下來」這麼簡單。它要面對的是很多不同類型的狀態：

當前任務目標
限制條件
使用者偏好
外部文件
工具輸出
決策歷史
跨步驟交接狀態
跨多天延續的工作上下文

真正麻煩的從來不是能不能存，而是什麼值得存、存在哪一層、什麼時候該被取回、什麼時候應該被淘汰，以及怎麼避免舊資訊反過來污染新決策。換句話說，記憶不是便利功能，而是一套資訊治理機制。

我會把 Agent 的記憶分成三層

圖 1｜Agent 記憶系統的三層結構：當前上下文、長期偏好與流程狀態

1. 當前上下文

這一層最接近人的工作記憶。它處理的是現在目標是什麼、眼前限制是什麼、目前正在操作哪些檔案或資料，以及上一步卡在哪裡。它很重要，但也很短暫；如果把不該留在這一層的東西全塞進來，prompt 只會越來越長，資訊密度也會越來越失控。

2. 長期偏好與穩定事實

這一層放的是比較穩定、值得反覆沿用的資訊，例如使用者固定偏好、慣用平台、環境設定、寫作習慣與一再重複出現的專案規則。這些內容不該每次都重講，但也不應該混在大量即時噪音裡。

3. 流程狀態與外部紀錄

這一層常常最容易被忽略，但其實最關鍵。它包含的會是 ledger、handoff、任務清單、決策歷史、發佈紀錄、系統狀態檔，以及可追溯的工作紀錄。這些內容未必要全部直接塞進模型腦中，但它們往往才是整個協作系統真正穩定的骨架。

很多 Agent 不可靠，不是因為它笨，而是因為三層被混在一起

表面上大家都在討論記憶，但實際上很多系統只是把不同類型的資訊亂堆在同一個地方。常見失敗大概有兩種：

所有東西都塞進 prompt：結果就是 prompt 越來越長、重點越來越模糊，模型雖然「看過」，卻不一定真的抓得到當下最重要的訊號。
什麼都不保存，只靠對話自然延續：結果就是任務一切換就像重開機，多步驟流程很難穩定接續，昨天做過的判斷今天又得重來。

這兩種做法看起來相反，但本質上其實犯了同一個錯誤：沒有把不同類型的資訊，放進適合它的位置。

成熟的做法，不是讓 Agent 記住一切

真正成熟的做法，從來不是期待 Agent 變成萬能記憶體，而是要先承認：記憶本來就需要架構。你得主動決定哪些東西留在當前上下文、哪些東西進入長期記憶、哪些東西不該交給模型記，而應該寫進狀態檔或系統紀錄。

多 Agent 協作時，真正重要的是「交接能力」

當工作不再只是單一對話，而是包含規劃、執行、審查、修改、發佈與追蹤，關鍵問題就不再是「某個模型有沒有記得」，而是「下一個接手的角色，能不能從系統裡讀到足夠狀態？」

一份好的 handoff
清楚的 ledger
可追溯的決策紀錄
任務狀態的外部化
對「什麼值得留下」的明確原則

很多時候，真正讓系統變可靠的不是更多 prompt，而是這些結構。

這其實不是記憶問題，而是環境設計問題

過去大家談提示詞，常常重點是怎麼把一句話寫得更聰明；但當 Agent 開始進入真實工作流之後，真正拉開差距的能力，逐漸變成另一件事：你怎麼設計環境。

因為最後決定系統穩不穩的，往往不是模型本身，而是資訊怎麼流動、狀態怎麼切分、哪些東西應該持久化、哪些東西應該被淘汰，以及怎麼降低記憶污染。

一張表看懂：真正該管理的是哪種記憶

記憶類型	內容例子	適合放在哪裡	主要風險
當前上下文	當前任務、限制、即時資料	prompt / context window	太長、太雜、抓不到重點
長期偏好	使用者習慣、固定規則、環境偏好	長期記憶層 / profile	過時後未更新，影響判斷
流程狀態	handoff、ledger、決策紀錄、任務進度	外部狀態檔 / 系統紀錄	沒有維護，導致交接失敗

所以真正該問的，不是「怎麼讓它全部記起來」

如果今天有人說 Agent 老是忘東忘西，我覺得更值得問的通常不是「怎麼讓它全部記起來」，而是下面這幾個問題：

我們有沒有區分短期上下文與長期偏好？
我們有沒有外部化流程狀態？
我們有沒有定義什麼值得保存？
我們有沒有設計交接機制？

圖 2｜當 Agent 表現出「失憶」時，真正該檢查的是記憶分層、狀態外部化與交接設計

我現在越來越把記憶視為治理問題

因為只要牽涉到記憶，你其實同時也在處理成本、權限、可靠性、可驗證性與系統演化方向。記得太少，Agent 每次都要從零開始；記得太多，系統又會慢慢被低品質資訊、舊規則與錯誤假設拖垮。困難的地方從來不是能不能記，而是有沒有原則地記。

結語

下一階段真正會拉開差距的，也許不只是誰用到更強的模型，而是誰更早理解這件事：Agent 的價值從來不只來自生成能力，而來自它能否被放進一個有記憶、有狀態、有交接能力的工作系統裡，持續而穩定地運作。

當我們開始用這個角度思考，就會發現所謂的「失憶」很多時候其實不是能力缺陷，而是架構缺席。Agent 不是記不住，而是多數人根本還沒決定：什麼值得被記住，以及這些記憶之後要怎麼被用起來。

我是江中喬，一位具有 TPM 與產品管理背景的 AI 系統建構者，目前專注於 AI 認知增強系統與多 Agent 協作架構的設計與實踐。