江中喬 - Maki Chiang｜Notes (Page 3)

Maki Chiang｜Notes

Sign in Subscribe

江中喬

AI Agent 工作流的最後一哩路：從技術可行到商業可持續的經濟學挑戰

AI Agent 工作流的最後一哩路：從技術可行到商業可持續的經濟學挑戰

AI Agent 實現端到端自動化，聽起來很酷，但實際運作起來卻是另一回事？本文將從一個結合 Notion 與程式碼的實例出發，深入探討為何高昂的 Token 成本、系統穩定性挑戰，以及難以避免的人工介入，正成為阻礙自律型 AI Agent 商業化落地的三大關鍵經濟學問題。別只看技術展示，更要看背後的真實開銷！

AI 時代的工程師新定義：從寫程式到擁有客戶成效

AI 時代的工程師新定義：從寫程式到擁有客戶成效

AI 浪潮下，工程師的價值正在重塑。本文將從 Sierra 的「代理人工程師」一職出發，探討為何未來最稀缺的人才，是那些能跨越技術、產品與客戶場景，為最終商業成果負責的全方位角色。

與其堆砌指令，不如抑制幻覺：論大型語言模型在精確生成任務中的可靠性

與其堆砌指令，不如抑制幻覺：論大型語言模型在精確生成任務中的可靠性

當我們要求 AI 生成會議記錄或技術文件時，最常見的錯誤是試圖用越來越複雜的格式指令來控制輸出。然而，真正的關鍵或許恰恰相反：主動抑制模型的「創造力」，將它從自由的寫作者，轉變為一個受嚴格約束的轉譯器，這才是提升結果可靠性的核心。

AI 的典範轉移：從追求更大模型，到建構集體智能的「編排轉向」

AI 的典範轉移：從追求更大模型，到建構集體智能的「編排轉向」

AI 發展的下一波優勢，已不再是單一模型的規模競賽，而是來自於「編排」——將多個特化模型、工具與記憶體，組織成一個協作無間的集體智能系統。本文將以 Sakana AI 的 Fugu 模型為例，探討為何「編排者」的角色正在崛起，以及這場典範轉移如何定義下一代 AI 系統的能力邊界。

AI 不再只是搜尋框：當模型成為決策入口，你的品牌如何被「推薦」？

AI 不再只是搜尋框：當模型成為決策入口，你的品牌如何被「推薦」？

過去我們談 SEO，現在必須談 AIO。這不只是一個縮寫的改變，更是品牌競爭場域的徹底翻轉。當消費者與企業的購買決策起點，從傳統的「搜尋」轉向對 AI 的「提問」，你的品牌還能被看見嗎？本文將深入剖析這個從資訊檢索到決策介面的關鍵轉變，並提供企業調整策略的具體方向，確保你的產品與服務，能被新一代的 AI 守門人理解、推薦，進而觸及潛在客戶。

Prompt 即服務：當 AI 角色調校從程式碼部署走向資源治理

Prompt 即服務：當 AI 角色調校從程式碼部署走向資源治理

傳統上，調整 AI 角色需要修改程式碼並重新部署，過程緩慢且風險高。但當我們將 Prompt 視為可管理的「資源」，情況就完全不同了。本文探討如何透過 Prompt Management 將 AI 的行為調校從開發週期轉移到配置週期，這不僅是技術上的解耦，更是組織迭代能力的根本性提升。

模型之外的決勝點：AI 系統的 Harness Engineering 思維

模型之外的決勝點：AI 系統的 Harness Engineering 思維

當大型語言模型的性能逐漸趨同，真正的競爭優勢不再是模型本身，而是我們如何設計其周遭的系統。本文深入探討「Harness Engineering」的概念，揭示記憶、工具、驗證與回饋迴路等外圍系統，才是釋放 Agent 真正潛力、將概念驗證轉化為可維運產品的關鍵。

Claude Code Hooks 實戰：8 個讓 AI 不再闖禍的自動化規則

Claude Code Hooks 實戰：8 個讓 AI 不再闖禍的自動化規則

CLAUDE.md 是建議，Hooks 是法律。8 個可直接複製的自動化規則，讓 Claude Code 不再 git add .、不看 diff 就 commit、重試到死。附完整 settings.json 範例。

AI 寫程式的盲點：為何「看起來完成」不等於「已被驗證」？

AI 寫程式的盲點：為何「看起來完成」不等於「已被驗證」？

AI 程式助手看似強大，卻常留下未完成的「殘留課題」。這並非能力不足，而是其完成判定的機制有根本缺陷。本文將從 Anthropic 的官方文件出發，探討 AI Agent 如何將「視覺上的完成」誤認為「功能上的驗證」，並提出將驗證流程顯式化的實踐方法，確保交付的成果真正可用。

長上下文的陷阱：為何模型總是忽略中間的關鍵資訊？

長上下文的陷阱：為何模型總是忽略中間的關鍵資訊？

大型語言模型（LLM）的上下文視窗不斷擴大，但這不代表能隨意塞入大量資訊。研究揭示，LLM存在「中間遺忘」現象，導致模型常忽略長篇輸入中間的關鍵訊息。本文將深入探討此問題成因，並提供實用的「上下文工程」策略，教你如何精準佈局資訊，確保模型能有效捕捉並運用最重要的內容，真正發揮長上下文的潛力。

自動化內容管道的隱形陷阱：當 AI 悄悄扭曲了事實主語

自動化內容管道的隱形陷阱：當 AI 悄悄扭曲了事實主語

當全自動的 AI 內容管道，將新聞報導中的「否定者」誤植為「推進者」，悄悄扭曲了事實主語，會發生什麼？這不只是文筆問題，更是關乎事實歸因與因果關係的系統性風險。本文將從日本開發者親身經歷的真實事故出發，深入探討 AI 內容生成流程中潛藏的致命缺陷，並提出具體策略，助您設計出更可靠、更值得信賴的自動化內容管道，避免語意扭曲被放大成公開錯誤。

從經驗判斷到自動化閘門：AI 開發流程規模化的真正關鍵

從經驗判斷到自動化閘門：AI 開發流程規模化的真正關鍵

AI 系統的規模化挑戰，核心不在算力或演算法，而是如何將人類專家的「好壞」判斷，轉化為可自動執行的檢查條件。本文將深入探討，從 AWS AI-DLC 的實踐經驗出發，如何系統性地「蒸餾」這些隱性知識，讓 AI 開發從依賴「老師傅」的藝術，蛻變為可預測、可治理的現代工程實踐。

AI Agent 的下一步：從單次任務迴圈，到可持續運作的「迴圈工程」

AI Agent 的下一步：從單次任務迴圈，到可持續運作的「迴圈工程」

AI Agent 的單次任務展示令人驚艷，但要將其轉化為能自主處理複雜工作的可靠系統，挑戰才真正開始。本文探討「迴圈工程」如何成為關鍵，將單一的執行迴圈，擴展為一套包含規劃、驗證與技能模組化的工程體系，這才是決定 Agent 能否從概念驗證走向規模化應用的核心。

當規則吞噬了上下文：從一個 AI Agent 的失敗，反思治理框架的隱藏成本

當規則吞噬了上下文：從一個 AI Agent 的失敗，反思治理框架的隱藏成本

「為 AI 加上層層規則，真的能帶來安全與可靠嗎？」一個自律 Agent 的開發經驗揭示了驚人悖論：當治理框架過於複雜，它會反噬 AI 的上下文與注意力，讓規則本身取代了任務執行。這不只是技術問題，更是對 AI 設計哲學的深刻挑戰。

當 AI Agent 成為管理者：為何分派任務比親力親為更重要

當 AI Agent 成為管理者：為何分派任務比親力親為更重要

「AI Agent 怎麼會越用越笨？」當單一 AI 代理面對複雜任務，龐雜的上下文資訊往往導致效能下滑，甚至「失憶」。本文將揭示，解決之道並非盲目追求無限大的記憶體，而是讓主代理從「萬能執行者」轉型為「高效管理者」。透過分派任務給專職子代理，我們能有效隔離上下文、實現並行處理，讓主代理專注於高層次決策。這不僅是技術架構的典範轉移，更是打造穩健、智慧 AI 系

RAG 的安全幻覺：為何權限控制必須下沉，而非事後過濾

RAG 的安全幻覺：為何權限控制必須下沉，而非事後過濾

RAG 系統的權限管理，常被誤認為是應用層的事後補救。但這種「後置過濾」不僅導致檢索品質低落，更潛藏嚴重的資安風險。本文將深入探討，為何真正的安全、品質與治理，必須從源頭做起，將權限模型深度整合至資料庫與查詢層，實現「權限感知檢索」，而非將安全視為事後過濾的措施。

AI Agent 如何「學習」？答案可能與你想的不同：談系統化記憶與流程工程

AI Agent 如何「學習」？答案可能與你想的不同：談系統化記憶與流程工程

當我們談論 AI Agent 的「學習」時，多數人會聯想到模型權重的更新，彷彿數位大腦正在重新佈線。但實務上，絕大多數 Agent 的進化並非源於此。本文將剖析 Agent「學習」的真相：這是一場關於產品架構的演化，透過將偏好、技能與記憶「外部化」，並設計精巧的檢索與執行流程，讓 AI 系統的進步變得更像軟體工程，而非神秘的煉金術。

超越 Prompt Engineering：AI 效能的關鍵在於指令分層架構

超越 Prompt Engineering：AI 效能的關鍵在於指令分層架構

我們常誤以為 AI 工具的效能取決於 Prompt 的長度與複雜度，但真正的關鍵在於指令的「存放位置」。本文將探討如何透過 system、rules、skills 等分層設計，建立穩定、高效且可維護的 AI 系統，避免上下文浪費與長期運作下的指令遺忘問題。這是一種從「提示詞工藝」走向「系統架構」的思維轉變，也是打造可靠 AI 應用的核心。

企業 AI Agent 卡關的真正原因：不是不夠聰明，而是「不知道自己是誰」

企業 AI Agent 卡關的真正原因：不是不夠聰明，而是「不知道自己是誰」

企業 AI Agent 專案為何難以從概念驗證走向實際應用？常見的說法是模型不夠聰明或資料品質不佳。然而，真正的量產瓶頸，其實在於一個更基礎卻常被忽略的問題：當 Agent 執行任務時，它究竟代表誰？本文將深入探討，為何「身分認證、權限管理與行為追溯」才是 AI Agent 成功落地的關鍵基石，遠比技術性能更重要。

AI 助理的設定檔不是規則大全，而是知識索引

AI 助理的設定檔不是規則大全，而是知識索引

當 AI 助理的設定檔越來越臃腫，指令遵循率也隨之下降。問題往往不在規則本身，而是缺乏有效的導航與分層。本文探討如何將扁平的規則清單，重構成一個動態的知識索引系統，讓模型在正確的時機，載入正確的上下文，從而根本性地提升協作效率與可靠性。

Why Your Local LLM Is Returning Empty Responses (And How to Fix It)

Why Your Local LLM Is Returning Empty Responses (And How to Fix It)

Your Ollama API call returns 200 OK with done: true — but the response field is empty. The model isn't broken. It's writing everything into a thinking field you're not reading. One parameter fixes it.

為什麼你的本地 LLM 回傳空白？一個參數就能修好

為什麼你的本地 LLM 回傳空白？一個參數就能修好

你的 Ollama API 回 200 OK、done: true，但 response 是空字串。模型沒壞——它把所有 token 都寫進了 thinking 欄位。一個參數就能修好。

RAG 的三體問題 — 為什麼 Agent 時代正在拋棄它

RAG 的三體問題 — 為什麼 Agent 時代正在拋棄它

RAG 不是被更好的 RAG 取代，而是被長 context、Agent 漸進式搜尋、和 embedding 理論天花板三股力量同時夾擊。從預設選項變成其中一個選項，Context Engineering 才是正確的抽象層級。

你的 AI 沒有反對黨：為什麼單一 LLM 是一場 Echo Chamber

你的 AI 沒有反對黨：為什麼單一 LLM 是一場 Echo Chamber

你讓 Claude 寫了一段 code，然後請它 review 自己寫的 code。它說「看起來不錯」。恭喜你，你剛跑了一場一人選舉。Multi-agent 不是軍備競賽，是治理結構。

Loop Engineering：讓 AI Agent 自己跑起來的工程學

Loop Engineering：讓 AI Agent 自己跑起來的工程學

Addy Osmani、Boris Cherny、Peter Steinberger 提出的 Loop Engineering 框架——從 Prompt Engineering 到讓 AI Agent 自己反覆執行的第四層工程學。五種失敗模式診斷清單、Generator/Evaluator 分離原則、四個無聲成本。