Maki Chiang｜Notes (Page 2)

Maki Chiang｜Notes

Sign in Subscribe

從 Code Copilot 到 Workflow Architect：AI Agent 如何重組我們的工程工作流

從 Code Copilot 到 Workflow Architect：AI Agent 如何重組我們的工程工作流

AI Agent 的進化，正將工程師的角色從單純的程式碼執行者，轉變為更具策略性的工作流設計師。本文將透過一個實際案例，深入剖析 AI Agent 如何接手從需求理解到交付的完整工作流，並引導讀者思考我們該如何為這場技術革命做好準備。

超越模型崇拜：AI 的價值上限，取決於你的工作流設計

超越模型崇拜：AI 的價值上限，取決於你的工作流設計

當我們還在比較不同 AI 模型的跑分時，真正的價值瓶頸早已轉移。這篇文章將從一個非工程師打造「可成長 AI 秘書」的實踐出發，帶你深入探討：為何模型能力只是起點，而真正決定 AI 效能上限的，是我們為它設計的思考路徑、搜尋策略與記憶維護機制。

AI Agent 治理的藝術：在自動化與人為審批之間設計信任邊界

AI Agent 治理的藝術：在自動化與人為審批之間設計信任邊界

真正高效的 AI Agent 權限管理，並非天真地追求全自動化、移除所有人工確認。關鍵在於設計一套可預期的治理規則，將高頻率、低風險的路徑自動化，同時保留對高風險操作的人為審批邊界。本文以 Anthropic 的 Claude Code 為例，探討如何透過精細化的規則設計，在速度、責任與安全之間取得平衡，打造可信任的 AI 協作系統。

從單點測試到系統級 QA：如何有效評估複雜 AI Agent

從單點測試到系統級 QA：如何有效評估複雜 AI Agent

當 AI Agent 從單一指令的執行者，演化為能夠多步驟、跨工具、與環境互動的複雜系統時，傳統的單點評估方法便顯得捉襟見肘。本文將探討為何評估的複雜度必須與系統的複雜度對等，並提出一個從單元、整合到端到端模擬的系統級 QA 框架，以協助開發者跳脫「修 A 壞 B」的局部最佳化陷阱，建立真正穩健、可信賴的 AI Agent。

Leanstral 啟示錄：當 AI 學會讓編譯器糾錯，高可靠場景才真正開始

Leanstral 啟示錄：當 AI 學會讓編譯器糾錯，高可靠場景才真正開始

Mistral 的 Leanstral 1.5 不只是一個數學模型，它揭示了 AI 進入高可靠應用的關鍵路徑：不是追求更像人的直覺，而是建立一個由形式化語言、編譯器與驗證器構成的「生成—檢查—修正」閉環。這讓 AI 的產出能被機器嚴格證明，為軟體工程、數學甚至法律等領域帶來根本性的變革。

拆解 AI 工具的體感延遲：一套找出真正瓶頸的觀測方法論

拆解 AI 工具的體感延遲：一套找出真正瓶頸的觀測方法論

AI 工具反應慢，你是否也直覺歸咎於模型 API？一篇針對 Claude Code 的深度分析揭示，超過 99% 的體感延遲，其實來自工具鏈內部不透明的排程與等待，而非模型本身。這篇文章將帶你跳脫表面，學習如何運用「延遲預算」觀念，系統性地拆解 AI 應用效能瓶頸，建立一套完整的觀測性方法，從根本提升使用者體驗，打造真正流暢的 AI 互動。

打造可進化的 AI：為何我們該關注模型之外的系統架構

打造可進化的 AI：為何我們該關注模型之外的系統架構

AI 的持續進化，不必等待模型權重自我更新。真正可落地、可管理的進步，來自於將智慧「外部化」的系統架構。本文探討如何透過外部的記憶體、工具集與回饋迴路，建構能夠持續累積經驗、真正實現複利成長的 AI 系統。

MCP：AI 從單一工具進化為生態系統的關鍵協議

MCP：AI 從單一工具進化為生態系統的關鍵協議

當大型語言模型的性能逐漸普及，真正的競爭壁壘已不再是模型本身，而是其與真實世界互動的廣度與深度。Anthropic 提出的模型情境協議（MCP）正是為此而生，它不僅是個新工具，更可能成為 AI 基礎設施標準化的轉捩點，讓 AI 從點狀的 API 調用，進化成一個可互通、可組合的生態級系統。

AI的邏輯正確，不等於商業成功：為何人類的判斷與取捨無法外包

AI的邏輯正確，不等於商業成功：為何人類的判斷與取捨無法外包

當一家 98% 自動化的公司全盤採納 AI 提案，營收卻不增反減，這揭示了什麼？AI 能優化局部邏輯，卻無法定義全局目標。本文深入探討，為何在 AI 協作中，人類必須掌握對目標函數、風險與取捨的最終定義權，這才是企業真正無法外包的核心價值，也是建構有效「人機迴圈治理」的關鍵。

AI 產業的價值轉移：從 Token 供應商到企業營運夥伴

AI 產業的價值轉移：從 Token 供應商到企業營運夥伴

AI 產業正經歷一場深刻的價值鏈重組。模型大廠不再滿足於單純提供 API，而是積極轉型為企業的深度營運夥伴。這篇文章將帶你深入探討，為何這場轉變勢不可擋，以及它如何重新定義 AI 競爭的關鍵，從模型性能轉向實際的商業成果交付。

Loop Engineering：AI 工程的第三次範式轉移

Loop Engineering：AI 工程的第三次範式轉移

Prompt Engineering 回答「怎麼說」，Context Engineering 回答「說什麼」，Loop Engineering 回答「說完之後呢」。日本社群率先框架化的第三次範式轉移 — 從單次產出到持續驗證迴圈。

Prompt Layer 的 Production 實踐：我怎麼用 400 行 Markdown 治理七個 AI

Prompt Layer 的 Production 實踐：我怎麼用 400 行 Markdown 治理七個 AI

讓 AI 越用越懂你有兩條路：改模型權重或改 context。我選了後者，用 400 行 Markdown 治理七個 AI — 三層分離、四級 Preset、撞牆停手、Codex review gate。這是 prompt layer 在 production 的實戰紀錄。

$Agent 的數學：為什麼 95% 的可靠性不夠用$

Agent 的數學：為什麼 95% 的可靠性不夠用

你花了兩週打磨一個 AI Agent，單步成功率 95%。然後讓它跑 20 步的真實任務 — 端對端成功率只剩 36%。這就是為什麼 workflow-first 不是保守，而是唯一被數學驗證的策略。

AI Agent 協作的真相：為什麼「多腦同思，單手寫入」才是王道？

AI Agent 協作的真相：為什麼「多腦同思，單手寫入」才是王道？

多智能體系統的潛力常被「平行寫入」的混亂所抵銷。本文探討一種更穩健的治理模式：讓多個 AI 扮演顧問，提供觀點與方案，但最終由單一執行路徑來維持決策的完整與可追責性。這不僅是技術架構的選擇，更是確保系統可控、可信的關鍵原則。

Agent 可靠性的最後一哩路：將執行環境從終點線變成領航員

Agent 可靠性的最後一哩路：將執行環境從終點線變成領航員

當 AI Agent 任務越拉越長，單純提升模型能力已不足以保證成功。真正的挑戰在於如何處理過程中不斷累積的微小誤差。本文從 Replit 的實踐出發，探討下一代 Agent 架構的核心命題：將執行環境從被動的沙盒，轉化為主動、可校正的回饋系統，這才是打造可信任自主系統的關鍵。

從「未完成」到「偵察兵」：AI Agent 如何重塑 Draft PR 的戰略價值

從「未完成」到「偵察兵」：AI Agent 如何重塑 Draft PR 的戰略價值

AI Agent 的崛起，正徹底改寫軟體開發的遊戲規則。過去被視為「未完工」的 Draft PR，如今搖身一變，成為主動探測潛在衝突與依賴的「偵察介面」。這不僅讓團隊能提早預見風險，更將軟體協作從被動的事後審查，推向積極的事前探索，預示著 Agent-Native 開發的新時代。

AI 產品架構的再思考：為何我們應該將記憶、中介層與 UI 分開迭代？

AI 產品架構的再思考：為何我們應該將記憶、中介層與 UI 分開迭代？

想像一下，AI 產品的創新、穩定與使用者體驗，不再互相牽制，而是各自加速演進。本文將深入探討一種模組化架構，如何將 AI 系統的核心「記憶」、穩固的「中介層」與靈活的「使用者介面」拆解為獨立的生命週期，讓你的 AI 產品在快速變化的市場中，既能保持前沿創新，又能兼顧系統穩健與用戶滿意度。

AI 開發的典範轉移：從即興指令到計畫驅動

AI 開發的典範轉移：從即興指令到計畫驅動

當 AI 工具的計價模式轉向 Token 制，真正的成本已非 prompt 長度，而是來回修改的浪費。本文深入探討，為何在 AI 時代，最有效的開發紀律是回歸基本功：先定義計畫、邊界與驗收條件，將開發流程從即興問答，轉變為目標清晰的計畫執行，這不僅能省下 Token，更能提升交付品質。

快，不等於好：Anthropic 事件給 AI 產品的信任課

快，不等於好：Anthropic 事件給 AI 產品的信任課

近期 Anthropic 對於 Claude 模型品質下降的回應，不僅是一次成功的危機處理，更揭示了 AI 產品開發的核心挑戰。當我們過度追求反應速度，犧牲的可能是模型的推理深度與答案品質，最終侵蝕使用者最珍貴的資產——信任。好的 AI 體驗，並非單純追求速度，而是延遲、智能與信任三者的共同最適。

將模型選擇權還給使用者：從 BYOK 看 AI 產品的治理邊界

將模型選擇權還給使用者：從 BYOK 看 AI 產品的治理邊界

你是否曾因 AI 應用綁定特定模型，而在隱私、成本或效能上感到不便？本文將深入探討「自帶金鑰」（BYOK）模式，如何將模型選擇權交還給使用者。這不僅是功能上的彈性，更是一種重塑 AI 產品治理邊界、建立更可信任協作關係的關鍵思維。一起來看看 BYOK 如何解決痛點，讓 AI 真正為你所用！

停止追逐評分：AI 品質的關鍵在於「錯誤治理」，而非自動化

停止追逐評分：AI 品質的關鍵在於「錯誤治理」，而非自動化

AI 品質真正的分水嶺，不在更快更多的自動評分，而在能否系統性辨識錯誤、定義失敗型態，並讓領域專家參與基準設計。與其迷信分數，不如把評估當成一套治理機制。

從 AI 助理到執行代理：我們真正需要的，是「信任架構」

從 AI 助理到執行代理：我們真正需要的，是「信任架構」

當 AI 從聊天工具走向可自主執行任務的代理，真正的門檻不是模型更強，而是流程、責任邊界、工具規則與驗證機制是否被清楚定義。可信任的 agent，靠的是完整的信任架構，而不是一句「交給 AI」。

當指標成為目標：為何我們需要「看不見的對手」來守護 AI 品質？

當指標成為目標：為何我們需要「看不見的對手」來守護 AI 品質？

公開 benchmark 一旦成為競逐目標，就會迅速失去辨識力。真正能守住 AI 品質邊界的，不是更熱鬧的排行榜，而是私有測試集、隱藏資料與更貼近真實場景的評估設計。

比起刪除，停用 IAM 帳號為何是更安全的選擇？從系統可恢復性談帳號治理

比起刪除，停用 IAM 帳號為何是更安全的選擇？從系統可恢復性談帳號治理

當員工離職或專案結束，直覺反應是刪除帳號以求「乾淨」。然而，這種看似徹底的做法，卻隱藏著不可逆的風險，一旦誤刪或需要追溯，將造成難以彌補的後果。本文將從系統安全與可恢復性的角度深入探討，為何「停用」而非「刪除」帳號，才是更成熟、更具韌性的權限治理策略，並說明如何建立一套保留審計軌跡、簡化還原程序的安全退場機制。

Context 不是越多越好：頂尖 AI 系統都在實踐的減法工程學

Context 不是越多越好：頂尖 AI 系統都在實踐的減法工程學

我們常直覺地認為，給予 AI 越多資料，它就會越聰明。但實務經驗恰恰相反：過多的無關資訊常會稀釋關鍵信號，導致模型失焦、引用錯誤。本文將探討 Context Engineering 中的「減法哲學」，說明為何精準的資訊過濾與排序，遠比單純擴充上下文更能提升大型語言模型的推理品質。