AI - Maki Chiang｜Notes (Page 2)

Maki Chiang｜Notes

Sign in Subscribe

AI

A collection of 444 posts

從對話到操控：當 AI Agent 掌握作業系統，競爭的終局是什麼？

從對話到操控：當 AI Agent 掌握作業系統，競爭的終局是什麼？

AI 助手不再只是聊天工具，它們正深入作業系統，成為能直接操控數位環境的強大代理。這場典範轉移，不僅改變了我們與 AI 互動的方式，更將競爭焦點從模型智慧轉向更深層的權限治理、系統可觀測性與安全。當 AI 掌握了系統控制權，我們該如何建立信任、有效管理，並確保其運作的可靠性？

MCP 不只是新工具：AI 從對話層走向本地執行層的架構權衡

MCP 不只是新工具：AI 從對話層走向本地執行層的架構權衡

MCP 的真正意義，不是讓 AI 多接一個工具，而是把它從對話層推進到可操作本地系統的執行層。當 Agent 開始真正動手，架構競爭就會落在本地權限、可控性與雲端擴展之間的成熟權衡。

AI 治理不是合規包袱，而是規模化創新的安全底層

AI 治理不是合規包袱，而是規模化創新的安全底層

許多企業將 AI 治理視為限制創新的束縛，但這正是導入失敗的關鍵誤區。本文將深入探討，AI 治理如何作為一個「賦能層」，為大規模應用建立可承受風險的安全基礎，讓生成式 AI 從零星試點走向可持續的攻守兼備體系，助您釋放其真正潛力。

我的 AI Agent 把自己的幻覺當事實引用 — 以及我如何用 8 行設定檔防止它

我的 AI Agent 把自己的幻覺當事實引用 — 以及我如何用 8 行設定檔防止它

我的 AI Agent 把自己的幻覺當事實引用。AI Agent 記憶的 Ouroboros Effect — 以及如何用 ACA 的 source tier、provenance chain 和 audit trail 阻止它。

My AI Agent Cited Its Own Hallucination as Fact — And How I Stopped It With 8 Lines of Config

My AI Agent Cited Its Own Hallucination as Fact — And How I Stopped It With 8 Lines of Config

My AI agent cited its own hallucination as fact. The Ouroboros Effect in AI agent memory — and how ACA stops it with source tiers, provenance chains, and audit trails.

企業導入生成式 AI 的真正風險，不在模型，在組織

企業導入生成式 AI 的真正風險，不在模型，在組織

企業導入生成式 AI 時，許多公司誤將焦點放在技術設定，卻忽略了最大的資安盲點：人的行為。本文將透過真實案例，深入剖析為何再嚴密的安全機制都可能被人為繞過，並強調 AI 治理的核心在於組織工程，必須從建立「不輸入機密」的制度與文化著手，才能真正築起防線。

AI的複利引擎：為什麼自進化迴路是模型能力商品化之後的真正護城河

AI的複利引擎：為什麼自進化迴路是模型能力商品化之後的真正護城河

當大型語言模型的能力差距日益縮小，真正的競爭已不再是參數規模，而是系統的「學習效率」。本文將深入解析，為何打造低成本、可持續的自主經驗循環，將成為下一代 AI 系統的決勝關鍵，並帶你一窺其運作框架與實務挑戰，理解如何為你的 AI 建立一道難以超越的護城河。

Agent 失控的真正原因：當「指令」不足以駕馭 AI，我們需要的是「協定」

Agent 失控的真正原因：當「指令」不足以駕馭 AI，我們需要的是「協定」

我們常將 AI 的脫序行為歸咎於模型不夠聰明，但真正的問題可能出在我們溝通的方式。當模糊的自然語言指令無法約束 AI 的「策略性偷懶」時，將互動模式從「說服」升級為「協定」，才是建立可治理 AI 系統的關鍵一步。這篇文章將深入探討 AI 脫序行為背後的機制，並提出「協定工程」作為解決方案。

別再用 ID-level Recall 自我安慰：RAG 評估的真正陷阱

別再用 ID-level Recall 自我安慰：RAG 評估的真正陷阱

許多團隊在評估 RAG 系統時，常陷入一個誤區：過度依賴基於文件 ID 的 Recall 指標。這種看似直觀的方法，實際上可能掩蓋了內容檢索的真實品質，讓我們錯把表面的「命中」當成真正可用的內容召回。本文將從一個真實案例出發，探討為何這種評估方式是危險的，以及如何建立更誠實、更能反映系統真實能力的評估框架。

從即興到可審計：為何你的 AI 協作需要一份工程日誌

從即興到可審計：為何你的 AI 協作需要一份工程日誌

AI 協作產出的程式碼與決策，若缺乏可追溯的歷程，將成為難以審計的黑箱。這種即興式的生產模式，不僅造成知識資產的流失，更在團隊交接與系統治理上埋下隱患。本文探討如何將 AI 對話從短暫的記憶轉化為結構化的工程日誌，以 Claude Code 的本地日誌功能為例，展示如何建立一套可驗證、可接手、可治理的 AI 協作工作流。

NVIDIA NemoClaw 的啟示：企業導入開源 Agent，為何疊加式治理勝過重造輪子？

NVIDIA NemoClaw 的啟示：企業導入開源 Agent，為何疊加式治理勝過重造輪子？

NVIDIA 的 NemoClaw 平台，不僅為開源 AI Agent 框架 OpenClaw 築起企業級安全護欄，更揭示了企業導入 Agent 生態的全新策略：與其從零重造輪子，不如在既有開放生態上，巧妙疊加一層驗證與治理框架。這篇文章將深入探討，為何這種「疊加式治理」思維，將成為未來 AI Agent 競爭的關鍵。

當 Web Agent 能在你的筆電上「看見」螢幕：Agent 經濟學的轉捩點

當 Web Agent 能在你的筆電上「看見」螢幕：Agent 經濟學的轉捩點

想像一個 Web Agent 能在你的筆電上「看見」螢幕、自主運行，且幾乎零成本。過去，Agent 的能力與費用總與雲端 API 深度綁定，但隨著本地多模態模型崛起，這場遊戲的規則正被徹底改寫。本文將深入探討這項技術如何打破傳統限制，不僅降低成本，更為 Agent 的長時間自主運行與個人化應用開啟全新篇章。

從 Copilot 到自動化工程師：當 AI 開始擁有 Commit 權限

從 Copilot 到自動化工程師：當 AI 開始擁有 Commit 權限

當 AI 程式碼工具不再只是提供建議，而是能直接修改、提交程式碼，這不僅是技術的躍進，更是軟體開發流程中權力邊界的重大轉移。從「副駕」到「自動化工程師」，這項變革如何重塑我們的開發模式？我們又該如何建立一套完善的權限治理、自動化驗證與快速回滾機制，以確保 AI 協作的效率與安全？本文將深入探討這場轉變帶來的挑戰與機會。

Agent 框架之爭：為何成熟團隊看的不是功能，而是治理模型？

Agent 框架之爭：為何成熟團隊看的不是功能，而是治理模型？

許多團隊在選擇 AI Agent 框架時，常誤以為這是一場功能與開發速度的競賽。然而，成熟的團隊深知，真正的挑戰在於如何平衡系統的控制粒度、可觀測性，以及團隊自身的治理能力。本文將從實務經驗出發，帶你深入探討，為何框架選型實質上是一場關於技術治理與長期控制的策略性權衡，而非單純的技術選型，並揭示如何避免短期的開發便利演變成日後的維護惡夢。

多代理協作的真價值：從 Prompt Engineering 到 Workflow Engineering

多代理協作的真價值：從 Prompt Engineering 到 Workflow Engineering

許多人對多代理（Multi-agent）系統的想像是讓 AI 角色扮演，但這遠非全貌。其真正潛力在於將複雜、脆弱的人工作業流程，重構成可分工、可驗證、可持續迭代的自動化生產線。本文將以一個具體的開發框架為例，探討這種從「提示工程」到「工作流工程」的思維轉變，以及它如何為 AI 的規模化落地提供務實的路徑。

別再單點突破：打造實用 AI Agent 的關鍵是組合技，而非單一模型

別再單點突破：打造實用 AI Agent 的關鍵是組合技，而非單一模型

許多 AI Agent 在展示時看似完美，一進入實務就頻頻出錯。問題往往不在模型本身，而在於系統設計。本文將探討如何跳脫單一技術的迷思，透過組合 ReAct、Reflection、Self-Consistency 等多種手法，打造出真正能上線運作的 Agent 系統。

從提示詞工程到上下文工程：這不只是延伸，而是系統設計的質變

從提示詞工程到上下文工程：這不只是延伸，而是系統設計的質變

你是否也曾將「上下文工程」視為「提示詞工程」的簡單延伸，以為只是把提示詞寫得更長、更複雜？本文將顛覆你的想像，揭示上下文工程的真正核心——它不只是文字遊戲，更是一門精密的系統設計學問。我們將深入拆解其七大關鍵要素，說明如何巧妙組合檢索、記憶、工具與權限，讓大型語言模型從單純的對話夥伴，一躍成為能解決複雜問題、執行多步驟任務的強大工作系統。

AI 程式碼審查的系統性思考：為何流水線勝過單一巨型提示

AI 程式碼審查的系統性思考：為何流水線勝過單一巨型提示

當我們將大型程式碼變更直接丟給 AI 審查時，往往得到昂貴又充滿雜訊的結果。真正的解決方案，是將審查任務拆解成安全性、效能、風格等多個專門的視角，建立一個協同工作的 AI 流水線。這篇文章探討如何從「提示工程」轉向「系統設計」的思維，來打造真正可靠的 AI 輔助開發流程。

AI Agent 的失憶症：為什麼長期記憶不能只靠摘要，而需要一張「回溯地圖」？

AI Agent 的失憶症：為什麼長期記憶不能只靠摘要，而需要一張「回溯地圖」？

當 AI Agent 的記憶只剩下摘要，它就成了一個不斷失真的壓縮器。我們需要一種新的記憶架構，它不試圖取代原始事實，而是像一張精確的地圖，引導 Agent 找回最完整的脈絡與細節，這才是建立可靠、可追溯的自主系統的關鍵。

當我們用 Markdown 和 AI 對話，是否正落入工程慣性的陷阱？

當我們用 Markdown 和 AI 對話，是否正落入工程慣性的陷阱？

業界幾乎將 Markdown 奉為與 AI 協作的標準格式，因其對人類的友善與簡潔。然而，這種便利性可能讓我們忽略了自動化流程的真正需求：機器的可解析性、語義的保真度，以及流程的安全性。本文將探討，為何在 AI 驅動的開發中，一個更結構化的格式（如 HTML）可能才是更穩健、更安全的選擇，並挑戰我們對「最佳中介格式」的既有認知。

AI 記憶的自我污染：當 Agent 的夢境成為新的攻擊面

AI 記憶的自我污染：當 Agent 的夢境成為新的攻擊面

當 AI Agent 具備自主整合記憶的「夢境」機制，這項強大能力卻可能成為前所未見的攻擊面。想像一下，Agent 的輸出在無形中轉化為對自身的惡意指令，形成一種難以察覺的「自我提示注入」。本文將深入解析這種新型態的記憶污染風險，探討其運作原理與潛在危害，並強調為何「記憶治理」將是自主 Agent 時代不可或缺的核心安全課題。

MCP 的真正價值：為何將資料處理能力「模組化」是 Agent 導入企業的關鍵一步

MCP 的真正價值：為何將資料處理能力「模組化」是 Agent 導入企業的關鍵一步

MCP 的價值不只在於讓 Agent 接上資料湖，而在於把原本零散的資料處理能力封裝成可插拔、可治理的協議介面。當能力被模組化，企業導入 AI Agent 的門檻就會從繁重整合工程，下降為較可控的系統設計問題。

從 Fable 5 外洩的 System Prompt，看 Anthropic 的五個戰略轉向

從 Fable 5 外洩的 System Prompt，看 Anthropic 的五個戰略轉向

Fable 5 的外洩 system prompt 揭示了 Anthropic 的五個戰略方向：雙軌安全制、MCP App 消費者生態、Skills 平台化、跨 session 持久化、以及從真實案例學來的精細安全規則。

AI 自我迭代的陷阱：跑得再快，方向錯了都是枉然

AI 自我迭代的陷阱：跑得再快，方向錯了都是枉然

當 Agent 開始自我迭代，真正的風險不在優化速度太慢，而在目標函數一開始就設錯。方向偏了，自動化只會更有效率地把系統推向錯誤。

不只是 Demo：從微軟的 Agent Framework 看企業 AI 的基礎設施化

不只是 Demo：從微軟的 Agent Framework 看企業 AI 的基礎設施化

過去一年，AI Agent 的討論多半圍繞在驚豔的 Demo。但當微軟開始將 Agent 框架標準化、內建治理流程，這代表什麼？這是一個重要訊號：代理人正從實驗性玩具，轉變為可被企業組織吸收、管理的基礎設施。重點不再是「能做什麼」，而是「如何規模化地做好」。這篇文章將深入探討，企業如何準備迎接這場轉變。