前景 Sub‑agent 才是拯救 Claude Code token 的祕密武器
看到 Claude Code 被 context 污染卡住?用前景 sub‑agent 把 token 省回來,真的超省心。
你最近有在玩 Claude Code 嗎?我剛發現一個超實用的技巧,能把一堆被 MCP 吃掉的 token 直接省回來,感覺像找到了隱藏的寶藏。
上下文污染到底有多卡住開發流程?
在我用 Claude Code 做一個十步的 coding 任務時,MCP 每次呼叫都會把整個執行結果灌進主 context。結果是,原本 2,500 token 的上限瞬間被塞滿,後面的每一次回合都得把這堆歷史資料重送一遍。Claude 甚至會拋出警告說輸出已超過 10,000 token,簡直是「token 泡麵」的現實寫照。
前景 Sub‑agent:把噪音關在隔離室
解法其實蠻直接:把 MCP 呼叫包進一個前景 sub‑agent。這個 sub‑agent 有自己的 context window,所有中間結果都只留在它裡面,最後只回傳一段精簡摘要。根據 Vectara 的官方部落格,這種隔離機制正是為了防止「context pollution」而設計的。我的第一反應是:這不就是把雜訊搬到另一個房間去,自己卻只收到結論嗎?實測下來,原本可能吃掉幾萬 token 的 MCP,最後只剩幾百 token,省下的成本真的讓人笑不出來。
同時跑多個前景 Sub‑agent:省 token 更省時間
更妙的是,前景 sub‑agent 可以平行執行。只要在同一條訊息裡開多個 sub‑agent,Claude 會同時處理它們,然後把每個的摘要依序丟回主 context。這樣不只 token 減少,整體回應速度也提升。MIT 的研究報告提到,透過角色分離(role separation)讓規劃與實作代理分開工作,能有效降低上下文干擾,我覺得這跟前景 sub‑agent 的概念不謀而合。
實務小技巧與常見誤解
- Skill ≠ Sub‑agent:Skill 只是 prompt 模板,跑在主 context,根本不具備隔離功能。
- 使用 /compact 或 /clear 只能是事後補救,資訊會有遺失風險。
- 如果真的要限制 MCP 輸出大小,可以調整
MAX_MCP_OUTPUT_TOKENS,但這只是截斷,仍然會佔用大量 token。
總之,前景 sub‑agent 就像給你的開發流程裝了一個「防噪」濾網,讓主 context 保持乾淨,省下的 token 直接變成開發成本的減法。
延伸閱讀
- Introducing Sub‑agents – Vectara
- Mitigating Context Pollution via Role Separation in Code‑as‑Action Agents
- Understanding Claude Code's Full Stack: MCP, Skills, Subagents
如果你還在主 context 裡堆滿所有 MCP 輸出,想想看:下次再開發同樣的功能,會不會因為 token 用光而被迫重啟?
最後拋個問題:在未來的 AI 開發環境裡,你認為「隔離」會成為所有大型模型的標配功能,還是只會是少數高階用戶的專屬技巧?