Agent 不是真的失憶,而是多數人從未設計過記憶系統
當 Agent 開始進入真實工作流,問題往往不是模型記不住,而是我們從來沒有替它設計上下文、長期記憶與狀態交接的機制。
很多人在把 Agent 真正放進工作流之後,會很快遇到一種熟悉的挫折:
它怎麼又忘了。
上一輪才確認過的規則,下一輪像沒發生過;昨天才講清楚的偏好,今天又得重來一次;任務一切換,整個狀態像重新開機。
多數時候,Agent 並不是真的失憶,而是我們從來沒有替它設計過記憶系統。
這兩種說法看起來只差一點,背後其實是兩種完全不同的思考方向:前者把問題歸因於模型能力,後者把問題拉回系統設計。而我認為,真正值得處理的,通常是後者。
為什麼「記住」從來不是單一功能?
一旦 Agent 走出聊天視窗、進入真實工作流,所謂的記憶就不再只是「把說過的話存下來」這麼簡單。它要面對的是很多不同類型的狀態:
- 當前任務目標
- 限制條件
- 使用者偏好
- 外部文件
- 工具輸出
- 決策歷史
- 跨步驟交接狀態
- 跨多天延續的工作上下文
真正麻煩的從來不是能不能存,而是什麼值得存、存在哪一層、什麼時候該被取回、什麼時候應該被淘汰,以及怎麼避免舊資訊反過來污染新決策。換句話說,記憶不是便利功能,而是一套資訊治理機制。
我會把 Agent 的記憶分成三層
圖 1|Agent 記憶系統的三層結構:當前上下文、長期偏好與流程狀態
1. 當前上下文
這一層最接近人的工作記憶。它處理的是現在目標是什麼、眼前限制是什麼、目前正在操作哪些檔案或資料,以及上一步卡在哪裡。它很重要,但也很短暫;如果把不該留在這一層的東西全塞進來,prompt 只會越來越長,資訊密度也會越來越失控。
2. 長期偏好與穩定事實
這一層放的是比較穩定、值得反覆沿用的資訊,例如使用者固定偏好、慣用平台、環境設定、寫作習慣與一再重複出現的專案規則。這些內容不該每次都重講,但也不應該混在大量即時噪音裡。
3. 流程狀態與外部紀錄
這一層常常最容易被忽略,但其實最關鍵。它包含的會是 ledger、handoff、任務清單、決策歷史、發佈紀錄、系統狀態檔,以及可追溯的工作紀錄。這些內容未必要全部直接塞進模型腦中,但它們往往才是整個協作系統真正穩定的骨架。
很多 Agent 不可靠,不是因為它笨,而是因為三層被混在一起
表面上大家都在討論記憶,但實際上很多系統只是把不同類型的資訊亂堆在同一個地方。常見失敗大概有兩種:
- 所有東西都塞進 prompt:結果就是 prompt 越來越長、重點越來越模糊,模型雖然「看過」,卻不一定真的抓得到當下最重要的訊號。
- 什麼都不保存,只靠對話自然延續:結果就是任務一切換就像重開機,多步驟流程很難穩定接續,昨天做過的判斷今天又得重來。
這兩種做法看起來相反,但本質上其實犯了同一個錯誤:沒有把不同類型的資訊,放進適合它的位置。
成熟的做法,不是讓 Agent 記住一切
真正成熟的做法,從來不是期待 Agent 變成萬能記憶體,而是要先承認:記憶本來就需要架構。你得主動決定哪些東西留在當前上下文、哪些東西進入長期記憶、哪些東西不該交給模型記,而應該寫進狀態檔或系統紀錄。
多 Agent 協作時,真正重要的是「交接能力」
當工作不再只是單一對話,而是包含規劃、執行、審查、修改、發佈與追蹤,關鍵問題就不再是「某個模型有沒有記得」,而是「下一個接手的角色,能不能從系統裡讀到足夠狀態?」
- 一份好的 handoff
- 清楚的 ledger
- 可追溯的決策紀錄
- 任務狀態的外部化
- 對「什麼值得留下」的明確原則
很多時候,真正讓系統變可靠的不是更多 prompt,而是這些結構。
這其實不是記憶問題,而是環境設計問題
過去大家談提示詞,常常重點是怎麼把一句話寫得更聰明;但當 Agent 開始進入真實工作流之後,真正拉開差距的能力,逐漸變成另一件事:你怎麼設計環境。
因為最後決定系統穩不穩的,往往不是模型本身,而是資訊怎麼流動、狀態怎麼切分、哪些東西應該持久化、哪些東西應該被淘汰,以及怎麼降低記憶污染。
一張表看懂:真正該管理的是哪種記憶
| 記憶類型 | 內容例子 | 適合放在哪裡 | 主要風險 |
|---|---|---|---|
| 當前上下文 | 當前任務、限制、即時資料 | prompt / context window | 太長、太雜、抓不到重點 |
| 長期偏好 | 使用者習慣、固定規則、環境偏好 | 長期記憶層 / profile | 過時後未更新,影響判斷 |
| 流程狀態 | handoff、ledger、決策紀錄、任務進度 | 外部狀態檔 / 系統紀錄 | 沒有維護,導致交接失敗 |
所以真正該問的,不是「怎麼讓它全部記起來」
如果今天有人說 Agent 老是忘東忘西,我覺得更值得問的通常不是「怎麼讓它全部記起來」,而是下面這幾個問題:
- 我們有沒有區分短期上下文與長期偏好?
- 我們有沒有外部化流程狀態?
- 我們有沒有定義什麼值得保存?
- 我們有沒有設計交接機制?
圖 2|當 Agent 表現出「失憶」時,真正該檢查的是記憶分層、狀態外部化與交接設計
我現在越來越把記憶視為治理問題
因為只要牽涉到記憶,你其實同時也在處理成本、權限、可靠性、可驗證性與系統演化方向。記得太少,Agent 每次都要從零開始;記得太多,系統又會慢慢被低品質資訊、舊規則與錯誤假設拖垮。困難的地方從來不是能不能記,而是有沒有原則地記。
結語
下一階段真正會拉開差距的,也許不只是誰用到更強的模型,而是誰更早理解這件事:Agent 的價值從來不只來自生成能力,而來自它能否被放進一個有記憶、有狀態、有交接能力的工作系統裡,持續而穩定地運作。
當我們開始用這個角度思考,就會發現所謂的「失憶」很多時候其實不是能力缺陷,而是架構缺席。Agent 不是記不住,而是多數人根本還沒決定:什麼值得被記住,以及這些記憶之後要怎麼被用起來。
我是江中喬,一位具有 TPM 與產品管理背景的 AI 系統建構者,目前專注於 AI 認知增強系統與多 Agent 協作架構的設計與實踐。