AI coding

AI coding 變快之後，瓶頸變成『看得懂』

當 AI Agent 能在幾分鐘內噴出大量變更，團隊真正的成本會轉向審閱、追溯與治理。從『把脈絡綁進版本控制』談起，整理我會怎麼把可追溯性落到工程流程裡。

我最近看到一則 Threads 在聊一個很有趣的現象：AI coding 變快之後，開發團隊的新瓶頸不再是「寫得出來」，而是「看得懂、審得完、追得回」。

貼文提到 GitHub 執行長 Thomas Dohmke 參與的新創（文中稱 Entire），在種子輪就募到 6,000 萬美元、估值 3 億美元，主打要處理 AI 生成程式碼帶來的版本管理與可追溯性問題。數字我沒有去逐一核對，但它點到的痛點很真實。

AI 讓「版本控制」這件事變得不夠用

過去十幾年，Git 幾乎定義了軟體開發的協作方式：

這套機制背後有個隱含前提：變更的速度大致跟人類能理解的速度同一個量級。

但當你把 AI Agent 放進來，變更速度會直接跳一個維度：

真正的災難不是「AI 會寫錯」，而是「AI 會寫很多、而且看起來都像對」。

最後結果常見兩種：

貼文提到一個產品方向：把 AI 寫程式的「提示詞」與「思考脈絡」跟程式碼綁在一起，像是把每次生成都做成可追溯的 checkpoint。

我覺得這個方向的價值不只是 debug。

它在解決一個更根本的問題：當變更源頭不再是人類鍵盤，而是模型與 agent 的連鎖決策時，我們需要新的可解釋層。

在企業落地內部 AI 助理時，我最怕的是這種狀況：

如果能把「這次改動是因為什麼需求／哪些限制／參考了哪些文件／做過哪些嘗試」以機器可讀、也讓人類可快速掃過的格式保存下來，審閱效率會差很多。

假設你真的要在團隊裡導入 agentic coding，我會優先做的不是「讓 agent 寫更多」，而是把可追溯性當成系統的一部分：

每次 agent 變更都要附上 provenance：輸入（prompt、規格、資料源）、輸出（改動）、以及驗證（測試結果、lint、benchmark）
把「意圖」變成可檢索的資料：不要只留在 PR 描述，把它存成結構化 metadata（例如 JSON sidecar、commit note、或專用的 checkpoint store）
把審閱從逐行 diff 轉成「分層審閱」：先看意圖與驗證摘要，再決定哪些檔案需要深讀
建立降級路徑：一旦信心不足，就讓系統自動縮小改動範圍、回到保守策略，或把人叫進來做決策

這些做完，你才有資格談規模化。

我看到留言有人吐槽：「又是新的抽象層嗎……」這句我很有感。

答案是：會，而且很可能是必要的。

當開發從「人寫程式」走向「人設計工作流、機器產生改動」，版本控制要管理的對象就不只是 code，還包含：

你如果只管 code，本質上是在管最後一張輸出紙；問題是 AI 時代的關鍵常常藏在「輸出之前」。

我預期接下來一年，開發工具會出現一波很大的分水嶺：能把 agent 的產出變成可被審閱、可被追溯、可被治理的，才會真的進到企業主流程。