江中喬 - Maki Chiang｜Notes (Page 6)

Maki Chiang｜Notes

Sign in Subscribe

江中喬

AI Agent 工具治理：為何持續驗證比一份百大清單更重要

AI Agent 工具治理：為何持續驗證比一份百大清單更重要

在 AI Agent 工具如雨後春筍般冒出的時代，真正的挑戰並非選擇，而是管理。這篇文章探討為何工具清單會迅速失效，以及它如何轉化為團隊的技術負債。我們將從「工具治理」與「採用成本」的角度，提出一套實務框架，幫助你在快速變化的生態中，建立可持續的技術決策流程，確保技術投資的長期價值。

Agent 的下一步：從一次性 Demo 到可維運的 Durable Execution

Agent 的下一步：從一次性 Demo 到可維運的 Durable Execution

AI Agent 的發展瓶頸，並非模型不夠聰明或不夠自由，而是缺乏一套可靠的系統來管理其動態、長時程的執行過程。本文將深入探討，為何將 Agent 的「執行計畫」轉化為可追蹤、可恢復的「持久執行」工作流，才是讓 Agent 從酷炫展示走向真實生產環境的關鍵一步。準備好一窺 Agent 落地生產的秘密了嗎？

AI Agent 的下一步：從規則堆砌到「資深判斷」的語言化

AI Agent 的下一步：從規則堆砌到「資深判斷」的語言化

許多團隊在打造 AI Coding Agent 時，常專注於技術規則的堆砌，卻忽略了資深工程師的「判斷邏輯」與「行為模式」才是其真正價值核心。本文將深入探討如何將這些隱性知識語言化，讓 AI 不再只是聽命行事的工具，而是能像資深協作者般，理解情境、做出判斷，甚至主動引導工作流程，大幅提升團隊生產力。

超越聊天機器人：Workspace Agents 如何將 AI 升級為可治理的企業數位員工

超越聊天機器人：Workspace Agents 如何將 AI 升級為可治理的企業數位員工

當業界還在熱議新一代大型語言模型時，OpenAI 已悄悄推出 Workspace Agents，這項創新正將 AI 從單純的個人助理，轉變為企業可信賴、可審計的數位員工。這不僅是效率工具的升級，更是組織將 AI 深度整合進正式流程與治理框架的關鍵一步。它有效填補了通用 GPTs 在企業應用中，權責歸屬與合規性上的空白，為企業級 AI 應用開啟了新篇章。

AI 正在學會考試，但我們需要的是能解決未知問題的科學家

AI 正在學會考試，但我們需要的是能解決未知問題的科學家

大型語言模型在標準化測驗上屢創佳績，讓許多人對通用人工智慧的到來充滿期待。然而，這篇文章將深入探討，當這些頂尖模型面對沒有標準答案的真實科學難題時，其成功率竟不到 2% 的驚人落差。這項發現迫使我們重新思考：AI 的真正進步，究竟該定義為在已知考卷上刷高分，還是具備探索並解決未知問題的科學家精神？讓我們一起揭開這場評估迷思，思考 AI 未來的發展方向。

Agent 的下一步：讓記憶從外掛規則，走向內生策略

Agent 的下一步：讓記憶從外掛規則，走向內生策略

目前 AI Agent 的記憶管理過度依賴生硬的外部規則，這限制了它們的成長潛力。當我們將記憶操作視為一種 Agent 可自主學習的「工具」，並透過強化學習讓它自行演化出最佳策略時，Agent 才可能真正成熟。這不只是一個技術升級，更是重新定義了記憶在認知架構中的核心地位。

從對話到操控：當 AI Agent 掌握作業系統，競爭的終局是什麼？

從對話到操控：當 AI Agent 掌握作業系統，競爭的終局是什麼？

AI 助手不再只是聊天工具，它們正深入作業系統，成為能直接操控數位環境的強大代理。這場典範轉移，不僅改變了我們與 AI 互動的方式，更將競爭焦點從模型智慧轉向更深層的權限治理、系統可觀測性與安全。當 AI 掌握了系統控制權，我們該如何建立信任、有效管理，並確保其運作的可靠性？

MCP 不只是新工具：AI 從對話層走向本地執行層的架構權衡

MCP 不只是新工具：AI 從對話層走向本地執行層的架構權衡

MCP 的真正意義，不是讓 AI 多接一個工具，而是把它從對話層推進到可操作本地系統的執行層。當 Agent 開始真正動手，架構競爭就會落在本地權限、可控性與雲端擴展之間的成熟權衡。

AI 治理不是合規包袱，而是規模化創新的安全底層

AI 治理不是合規包袱，而是規模化創新的安全底層

許多企業將 AI 治理視為限制創新的束縛，但這正是導入失敗的關鍵誤區。本文將深入探討，AI 治理如何作為一個「賦能層」，為大規模應用建立可承受風險的安全基礎，讓生成式 AI 從零星試點走向可持續的攻守兼備體系，助您釋放其真正潛力。

我的 AI Agent 把自己的幻覺當事實引用 — 以及我如何用 8 行設定檔防止它

我的 AI Agent 把自己的幻覺當事實引用 — 以及我如何用 8 行設定檔防止它

我的 AI Agent 把自己的幻覺當事實引用。AI Agent 記憶的 Ouroboros Effect — 以及如何用 ACA 的 source tier、provenance chain 和 audit trail 阻止它。

My AI Agent Cited Its Own Hallucination as Fact — And How I Stopped It With 8 Lines of Config

My AI Agent Cited Its Own Hallucination as Fact — And How I Stopped It With 8 Lines of Config

My AI agent cited its own hallucination as fact. The Ouroboros Effect in AI agent memory — and how ACA stops it with source tiers, provenance chains, and audit trails.

UMP Defines the Wire. AMH Ships the Governance.

UMP Defines the Wire. AMH Ships the Governance.

Your AI agents can call tools, talk to each other, and present verifiable identities. But ask them what they decided yesterday, and they stare at you blankly. I built Agent Memory Hall to fix that.

企業導入生成式 AI 的真正風險，不在模型，在組織

企業導入生成式 AI 的真正風險，不在模型，在組織

企業導入生成式 AI 時，許多公司誤將焦點放在技術設定，卻忽略了最大的資安盲點：人的行為。本文將透過真實案例，深入剖析為何再嚴密的安全機制都可能被人為繞過，並強調 AI 治理的核心在於組織工程，必須從建立「不輸入機密」的制度與文化著手，才能真正築起防線。

AI的複利引擎：為什麼自進化迴路是模型能力商品化之後的真正護城河

AI的複利引擎：為什麼自進化迴路是模型能力商品化之後的真正護城河

當大型語言模型的能力差距日益縮小，真正的競爭已不再是參數規模，而是系統的「學習效率」。本文將深入解析，為何打造低成本、可持續的自主經驗循環，將成為下一代 AI 系統的決勝關鍵，並帶你一窺其運作框架與實務挑戰，理解如何為你的 AI 建立一道難以超越的護城河。

Agent 失控的真正原因：當「指令」不足以駕馭 AI，我們需要的是「協定」

Agent 失控的真正原因：當「指令」不足以駕馭 AI，我們需要的是「協定」

我們常將 AI 的脫序行為歸咎於模型不夠聰明，但真正的問題可能出在我們溝通的方式。當模糊的自然語言指令無法約束 AI 的「策略性偷懶」時，將互動模式從「說服」升級為「協定」，才是建立可治理 AI 系統的關鍵一步。這篇文章將深入探討 AI 脫序行為背後的機制，並提出「協定工程」作為解決方案。

別再用 ID-level Recall 自我安慰：RAG 評估的真正陷阱

別再用 ID-level Recall 自我安慰：RAG 評估的真正陷阱

許多團隊在評估 RAG 系統時，常陷入一個誤區：過度依賴基於文件 ID 的 Recall 指標。這種看似直觀的方法，實際上可能掩蓋了內容檢索的真實品質，讓我們錯把表面的「命中」當成真正可用的內容召回。本文將從一個真實案例出發，探討為何這種評估方式是危險的，以及如何建立更誠實、更能反映系統真實能力的評估框架。

從即興到可審計：為何你的 AI 協作需要一份工程日誌

從即興到可審計：為何你的 AI 協作需要一份工程日誌

AI 協作產出的程式碼與決策，若缺乏可追溯的歷程，將成為難以審計的黑箱。這種即興式的生產模式，不僅造成知識資產的流失，更在團隊交接與系統治理上埋下隱患。本文探討如何將 AI 對話從短暫的記憶轉化為結構化的工程日誌，以 Claude Code 的本地日誌功能為例，展示如何建立一套可驗證、可接手、可治理的 AI 協作工作流。

NVIDIA NemoClaw 的啟示：企業導入開源 Agent，為何疊加式治理勝過重造輪子？

NVIDIA NemoClaw 的啟示：企業導入開源 Agent，為何疊加式治理勝過重造輪子？

NVIDIA 的 NemoClaw 平台，不僅為開源 AI Agent 框架 OpenClaw 築起企業級安全護欄，更揭示了企業導入 Agent 生態的全新策略：與其從零重造輪子，不如在既有開放生態上，巧妙疊加一層驗證與治理框架。這篇文章將深入探討，為何這種「疊加式治理」思維，將成為未來 AI Agent 競爭的關鍵。

當 Web Agent 能在你的筆電上「看見」螢幕：Agent 經濟學的轉捩點

當 Web Agent 能在你的筆電上「看見」螢幕：Agent 經濟學的轉捩點

想像一個 Web Agent 能在你的筆電上「看見」螢幕、自主運行，且幾乎零成本。過去，Agent 的能力與費用總與雲端 API 深度綁定，但隨著本地多模態模型崛起，這場遊戲的規則正被徹底改寫。本文將深入探討這項技術如何打破傳統限制，不僅降低成本，更為 Agent 的長時間自主運行與個人化應用開啟全新篇章。

從 Copilot 到自動化工程師：當 AI 開始擁有 Commit 權限

從 Copilot 到自動化工程師：當 AI 開始擁有 Commit 權限

當 AI 程式碼工具不再只是提供建議，而是能直接修改、提交程式碼，這不僅是技術的躍進，更是軟體開發流程中權力邊界的重大轉移。從「副駕」到「自動化工程師」，這項變革如何重塑我們的開發模式？我們又該如何建立一套完善的權限治理、自動化驗證與快速回滾機制，以確保 AI 協作的效率與安全？本文將深入探討這場轉變帶來的挑戰與機會。

Agent 框架之爭：為何成熟團隊看的不是功能，而是治理模型？

Agent 框架之爭：為何成熟團隊看的不是功能，而是治理模型？

許多團隊在選擇 AI Agent 框架時，常誤以為這是一場功能與開發速度的競賽。然而，成熟的團隊深知，真正的挑戰在於如何平衡系統的控制粒度、可觀測性，以及團隊自身的治理能力。本文將從實務經驗出發，帶你深入探討，為何框架選型實質上是一場關於技術治理與長期控制的策略性權衡，而非單純的技術選型，並揭示如何避免短期的開發便利演變成日後的維護惡夢。

多代理協作的真價值：從 Prompt Engineering 到 Workflow Engineering

多代理協作的真價值：從 Prompt Engineering 到 Workflow Engineering

許多人對多代理（Multi-agent）系統的想像是讓 AI 角色扮演，但這遠非全貌。其真正潛力在於將複雜、脆弱的人工作業流程，重構成可分工、可驗證、可持續迭代的自動化生產線。本文將以一個具體的開發框架為例，探討這種從「提示工程」到「工作流工程」的思維轉變，以及它如何為 AI 的規模化落地提供務實的路徑。

別再單點突破：打造實用 AI Agent 的關鍵是組合技，而非單一模型

別再單點突破：打造實用 AI Agent 的關鍵是組合技，而非單一模型

許多 AI Agent 在展示時看似完美，一進入實務就頻頻出錯。問題往往不在模型本身，而在於系統設計。本文將探討如何跳脫單一技術的迷思，透過組合 ReAct、Reflection、Self-Consistency 等多種手法，打造出真正能上線運作的 Agent 系統。

從提示詞工程到上下文工程：這不只是延伸，而是系統設計的質變

從提示詞工程到上下文工程：這不只是延伸，而是系統設計的質變

你是否也曾將「上下文工程」視為「提示詞工程」的簡單延伸，以為只是把提示詞寫得更長、更複雜？本文將顛覆你的想像，揭示上下文工程的真正核心——它不只是文字遊戲，更是一門精密的系統設計學問。我們將深入拆解其七大關鍵要素，說明如何巧妙組合檢索、記憶、工具與權限，讓大型語言模型從單純的對話夥伴，一躍成為能解決複雜問題、執行多步驟任務的強大工作系統。

AI 程式碼審查的系統性思考：為何流水線勝過單一巨型提示

AI 程式碼審查的系統性思考：為何流水線勝過單一巨型提示

當我們將大型程式碼變更直接丟給 AI 審查時，往往得到昂貴又充滿雜訊的結果。真正的解決方案，是將審查任務拆解成安全性、效能、風格等多個專門的視角，建立一個協同工作的 AI 流水線。這篇文章探討如何從「提示工程」轉向「系統設計」的思維，來打造真正可靠的 AI 輔助開發流程。