前景 Sub‑agent 才是拯救 Claude Code token 的祕密武器

看到 Claude Code 被 context 污染卡住?用前景 sub‑agent 把 token 省回來,真的超省心。

前景 Sub‑agent 才是拯救 Claude Code token 的祕密武器

你最近有在玩 Claude Code 嗎?我剛發現一個超實用的技巧,能把一堆被 MCP 吃掉的 token 直接省回來,感覺像找到了隱藏的寶藏。

上下文污染到底有多卡住開發流程?

在我用 Claude Code 做一個十步的 coding 任務時,MCP 每次呼叫都會把整個執行結果灌進主 context。結果是,原本 2,500 token 的上限瞬間被塞滿,後面的每一次回合都得把這堆歷史資料重送一遍。Claude 甚至會拋出警告說輸出已超過 10,000 token,簡直是「token 泡麵」的現實寫照。

前景 Sub‑agent:把噪音關在隔離室

解法其實蠻直接:把 MCP 呼叫包進一個前景 sub‑agent。這個 sub‑agent 有自己的 context window,所有中間結果都只留在它裡面,最後只回傳一段精簡摘要。根據 Vectara 的官方部落格,這種隔離機制正是為了防止「context pollution」而設計的。我的第一反應是:這不就是把雜訊搬到另一個房間去,自己卻只收到結論嗎?實測下來,原本可能吃掉幾萬 token 的 MCP,最後只剩幾百 token,省下的成本真的讓人笑不出來。

同時跑多個前景 Sub‑agent:省 token 更省時間

更妙的是,前景 sub‑agent 可以平行執行。只要在同一條訊息裡開多個 sub‑agent,Claude 會同時處理它們,然後把每個的摘要依序丟回主 context。這樣不只 token 減少,整體回應速度也提升。MIT 的研究報告提到,透過角色分離(role separation)讓規劃與實作代理分開工作,能有效降低上下文干擾,我覺得這跟前景 sub‑agent 的概念不謀而合。

實務小技巧與常見誤解

  • Skill ≠ Sub‑agent:Skill 只是 prompt 模板,跑在主 context,根本不具備隔離功能。
  • 使用 /compact 或 /clear 只能是事後補救,資訊會有遺失風險。
  • 如果真的要限制 MCP 輸出大小,可以調整 MAX_MCP_OUTPUT_TOKENS,但這只是截斷,仍然會佔用大量 token。

總之,前景 sub‑agent 就像給你的開發流程裝了一個「防噪」濾網,讓主 context 保持乾淨,省下的 token 直接變成開發成本的減法。

延伸閱讀

如果你還在主 context 裡堆滿所有 MCP 輸出,想想看:下次再開發同樣的功能,會不會因為 token 用光而被迫重啟?

最後拋個問題:在未來的 AI 開發環境裡,你認為「隔離」會成為所有大型模型的標配功能,還是只會是少數高階用戶的專屬技巧?


原始來源:https://www.threads.com/@andrew54068/post/DVJRMrbmvnW