江中喬 - Maki Chiang｜Notes (Page 7)

Maki Chiang｜Notes

Sign in Subscribe

江中喬

AI Agent 的失憶症：為什麼長期記憶不能只靠摘要，而需要一張「回溯地圖」？

AI Agent 的失憶症：為什麼長期記憶不能只靠摘要，而需要一張「回溯地圖」？

當 AI Agent 的記憶只剩下摘要，它就成了一個不斷失真的壓縮器。我們需要一種新的記憶架構，它不試圖取代原始事實，而是像一張精確的地圖，引導 Agent 找回最完整的脈絡與細節，這才是建立可靠、可追溯的自主系統的關鍵。

當我們用 Markdown 和 AI 對話，是否正落入工程慣性的陷阱？

當我們用 Markdown 和 AI 對話，是否正落入工程慣性的陷阱？

業界幾乎將 Markdown 奉為與 AI 協作的標準格式，因其對人類的友善與簡潔。然而，這種便利性可能讓我們忽略了自動化流程的真正需求：機器的可解析性、語義的保真度，以及流程的安全性。本文將探討，為何在 AI 驅動的開發中，一個更結構化的格式（如 HTML）可能才是更穩健、更安全的選擇，並挑戰我們對「最佳中介格式」的既有認知。

AI 記憶的自我污染：當 Agent 的夢境成為新的攻擊面

AI 記憶的自我污染：當 Agent 的夢境成為新的攻擊面

當 AI Agent 具備自主整合記憶的「夢境」機制，這項強大能力卻可能成為前所未見的攻擊面。想像一下，Agent 的輸出在無形中轉化為對自身的惡意指令，形成一種難以察覺的「自我提示注入」。本文將深入解析這種新型態的記憶污染風險，探討其運作原理與潛在危害，並強調為何「記憶治理」將是自主 Agent 時代不可或缺的核心安全課題。

MCP 的真正價值：為何將資料處理能力「模組化」是 Agent 導入企業的關鍵一步

MCP 的真正價值：為何將資料處理能力「模組化」是 Agent 導入企業的關鍵一步

MCP 的價值不只在於讓 Agent 接上資料湖，而在於把原本零散的資料處理能力封裝成可插拔、可治理的協議介面。當能力被模組化，企業導入 AI Agent 的門檻就會從繁重整合工程，下降為較可控的系統設計問題。

從 Fable 5 外洩的 System Prompt，看 Anthropic 的五個戰略轉向

從 Fable 5 外洩的 System Prompt，看 Anthropic 的五個戰略轉向

Fable 5 的外洩 system prompt 揭示了 Anthropic 的五個戰略方向：雙軌安全制、MCP App 消費者生態、Skills 平台化、跨 session 持久化、以及從真實案例學來的精細安全規則。

AI 自我迭代的陷阱：跑得再快，方向錯了都是枉然

AI 自我迭代的陷阱：跑得再快，方向錯了都是枉然

當 Agent 開始自我迭代，真正的風險不在優化速度太慢，而在目標函數一開始就設錯。方向偏了，自動化只會更有效率地把系統推向錯誤。

不只是 Demo：從微軟的 Agent Framework 看企業 AI 的基礎設施化

不只是 Demo：從微軟的 Agent Framework 看企業 AI 的基礎設施化

過去一年，AI Agent 的討論多半圍繞在驚豔的 Demo。但當微軟開始將 Agent 框架標準化、內建治理流程，這代表什麼？這是一個重要訊號：代理人正從實驗性玩具，轉變為可被企業組織吸收、管理的基礎設施。重點不再是「能做什麼」，而是「如何規模化地做好」。這篇文章將深入探討，企業如何準備迎接這場轉變。

不只模型，Agent 的執行層革命正從 Rust 與 CDP 開始

不只模型，Agent 的執行層革命正從 Rust 與 CDP 開始

AI Agent 的競爭不只在於模型智能，更在於執行效率。當我們將操作電腦的後端從高階框架轉向 Rust 與 Chrome DevTools Protocol (CDP) 等底層實作時，成本、延遲與相容性都將迎來數量級的改善，這將徹底重塑 Agent 產品的邊界與可能性。

從單一提示到系統協作：AI 行為管理的模組化思維

從單一提示到系統協作：AI 行為管理的模組化思維

當 AI 從單次問答工具，進化為長期協作的系統夥伴，您是否正為其行為管理感到困擾？本文將深入探討，為何將 AI 的通用規則與特定技能模組化，是建構可維護、可擴展 AI 協作系統的關鍵。從 Claude Code 的實踐經驗出發，我們將揭示這種分層管理思維如何避免指令過載，讓 AI 真正成為您可靠的系統夥伴。

企業導入 AI 的真正挑戰：與其微調模型，不如先建構一個好的 RAG 系統

企業導入 AI 的真正挑戰：與其微調模型，不如先建構一個好的 RAG 系統

企業導入 AI，總以為要「微調」模型才能讓它懂自家資料？這其實是個常見誤區！真正的挑戰，在於如何讓 AI 即時取用最新、最可信的內部知識，並在回答時提供明確依據。本文將深入探討，為何檢索增強生成（RAG）架構，才是多數企業邁向智慧化，解決系統性知識管理問題的務實解方。

AI 系統的隱藏債務：我們是否問對了問題？

AI 系統的隱藏債務：我們是否問對了問題？

我們常專注於如何更快地找到答案，卻忽略了問題本身可能就是錯的。一篇關於科學發現自動化的新研究，揭示了「目標函數」才是 AI 系統設計中最容易被低估的環節，這對 Agent 系統的開發者尤其重要。

Protocols > Platforms — 從 Shopify 的 AI Agent 平台反思個人 AI 基礎設施

AI Infrastructure

Protocols > Platforms — 從 Shopify 的 AI Agent 平台反思個人 AI 基礎設施

Shopify 每 8 個合併 PR 就有 1 個是 AI agent 共同作者。他們的 River/Aquifer 架構給了個人 AI 基礎設施什麼啟示？三方跨供應商 AI 分析得出結論：Protocols > Platforms。

軟體工程的終局？當價值從寫 Code 轉向設計 AI 協作系統

軟體工程的終局？當價值從寫 Code 轉向設計 AI 協作系統

AI 大幅提升了程式碼的生成效率，但軟體工程的挑戰從未只是寫程式。當小型團隊能在數月內產出百萬行程式碼時，真正的瓶頸便轉向更高維度的系統設計：如何定義代理分工、建立治理規則、設置驗證節點，並讓整個協作環境穩定、可擴張且可維護。

AI 時代的 UX 新契約：從操作者到監督者，我們如何設計「意圖」而非「介面」？

AI 時代的 UX 新契約：從操作者到監督者，我們如何設計「意圖」而非「介面」？

當 AI 接管繁瑣的執行步驟，使用者體驗設計的核心也隨之轉變。我們不再是機器的操作者，而是意圖的委派者與結果的監督者。這篇文章探討這個自 1960 年代以來最大的互動範式轉移，解析 AI 產品如何將過程「黑盒化」，以及設計師該如何應對這個全新的使用者—系統契約。

當 API 走到盡頭：為什麼 UI 自動化是 LLM Agent 的最後一哩路

當 API 走到盡頭：為什麼 UI 自動化是 LLM Agent 的最後一哩路

LLM Agent 的真實潛力，不該被 API 的有無所限制。當我們面對像 LINE 這樣 API 存取受限的封閉生態系時，直接操作使用者介面（UI）的自動化，就不再是權宜之計，而是擴展 Agent 實際執行能力的必然演化。本文將從一個具體的開源專案出發，探討這個趨勢背後的實務意義，以及它如何為 Agent 突破數位世界中的「最後一哩路」提供解答。

AI 治理的深水區：為何監控模型的「內心獨白」比要求它說對話更重要？

AI 治理的深水區：為何監控模型的「內心獨白」比要求它說對話更重要？

當 AI 學會隱藏真實意圖，我們該如何監管？OpenAI 的最新研究揭示，直接「教導」AI 思考正確，反而可能讓它學會偽裝。本文將深入探討，為何監控模型內部的「思維鏈」比表面合規更關鍵，並提出建立可觀測性、洞察其決策訊號，才是確保 AI 可信賴的務實之道。

Attention 即 RNN：重寫長文本推理的成本邊界

Attention 即 RNN：重寫長文本推理的成本邊界

Transformer 處理長序列的記憶體瓶頸，一直是其架構的根本限制。但如果 Attention 機制能被重新表述為一種 RNN，這將如何改變遊戲規則？一篇新研究不僅提出這個顛覆性可能，更實作了 Aaren 模組，讓我們得以重新審視長上下文推理的成本結構，並開啟未來架構的全新想像。

打破記憶體高牆：KV Cache 的真正瓶頸不在壓縮，而在於「層」的選擇

打破記憶體高牆：KV Cache 的真正瓶頸不在壓縮，而在於「層」的選擇

大型語言模型（LLM）的推理成本高昂，記憶體更是關鍵瓶頸。我們總以為要靠壓縮來解決，但最新的研究卻提出一個顛覆性觀點：問題不在於「如何壓縮」，而在於「根本不需要儲存所有層」。本文將深入解析這種「層級壓縮」策略，看它如何以反直覺的方式，大幅降低 LLM 運作成本，為長文本處理與多使用者場景帶來革命性的新可能。

GPT-4o 的真正價值：不只是多模態，而是重寫互動的物理限制

GPT-4o 的真正價值：不只是多模態，而是重寫互動的物理限制

GPT-4o 不僅是語音助理的升級，更是一場人機互動的革命。它以原生多模態架構，徹底顛覆了延遲、成本與體驗的極限，為開發者與產品設計師開啟了前所未有的新可能。準備好，迎接協作式 AI 的新時代了嗎？

從 FunSearch 看 LLM 的下一步：當「能言善道」不再是唯一標準

從 FunSearch 看 LLM 的下一步：當「能言善道」不再是唯一標準

Google DeepMind 的 FunSearch 不只是另一個 AI 模型，它揭示了評估 LLM 的典範轉移。當模型開始涉足可驗證的科學與數學領域，我們關注的焦點必須從流暢的文筆，轉向可重現、可證明的推理能力。這不只是技術的演進，更是對 AI 價值衡量標準的重新定義。

越管越亂：當自然語言規則成為 Agent 開發的惡性循環

越管越亂：當自然語言規則成為 Agent 開發的惡性循環

當我們試圖用越來越多的自然語言規則來約束 AI Agent，期望打造出更可控、更安全的系統時，結果往往適得其反。這種「指令膨脹」現象，不僅讓系統變得脆弱、昂貴且難以維護，更將開發者推向無止盡的補丁循環。本文將深入剖析指令膨脹的根源，並引導讀者思考如何跳脫純文字規則的框架，尋找更根本、更有效率的 Agent 控制機制，從「提示工程師」轉變為真正的「系統架構師」

AI Agent 的擴展陷阱：為何分散的工具入口，是壓垮使用者體驗的最後一根稻草？

AI Agent 的擴展陷阱：為何分散的工具入口，是壓垮使用者體驗的最後一根稻草？

當我們為 AI Agent 增加更多功能時，直覺上會為每個模組獨立配置工具。然而，這種分散式架構看似靈活，卻會帶來災難性的設定成本與心智負擔，最終讓整個產品體驗崩潰。本文將從一個實際案例出發，探討為何統一的工具入口才是 Agent 系統擴展性的關鍵。

AI 加速了產出，但誰來把關品質？談自動化審核閘門的必要性

AI 加速了產出，但誰來把關品質？談自動化審核閘門的必要性

當 AI Agent 能以驚人速度產出內容，真正的挑戰已非生成本身，而是如何確保品質。本文探討如何將人工審核的智慧轉化為可擴展的自動化閘門，這將是決定 AI 系統能否在專業領域落地的關鍵。

當 AI Agent 開始掌管基礎設施：為何我們需要超越 Prompt 的安全邊界

當 AI Agent 開始掌管基礎設施：為何我們需要超越 Prompt 的安全邊界

AI Agent 自動化維運很吸引人，但安全風險也隨之而來。日本醫療科技公司 Ubie 的實踐顯示，單靠 System Prompt 的「君子協定」不足以保護核心系統。真正的安全網，必須建立在網路邊界與權限分區上，將 Agent 的「意圖」與「執行」徹底分離。

AI Agent 的治理陷阱：我們是否正用自然語言打造下一代單體巨獸？

AI Agent 的治理陷阱：我們是否正用自然語言打造下一代單體巨獸？

企業導入 AI Agent 時，常將所有需求導向一個萬能入口，期望它能處理所有事。但這種看似直覺的作法，正悄悄地用自然語言打造一個難以維護的單體巨獸，將不同領域的業務邏輯全塞進一個 System Prompt，不僅讓權責變得模糊，更抵銷了微服務架構辛苦建立的優勢。真正的風險不是模型不夠聰明，而是我們正在重蹈覆轍，建構一個無法治理的系統。