AI 最危險的產出不是錯誤的程式碼,是精緻的 Prototype
AI 把做的成本壓到趨近於零,但維護成本一毛沒少。當一個漂亮的 prototype 讓所有人忘記問 why,真正的危險才開始。
你有沒有過這種經驗?
週五下午,靈感一來,打開 AI coding tool,三個小時後螢幕上出現了一個功能完整的內部系統 prototype。儀表板、管理後台、報表中心、甚至還有即時通知和權限管理。你截圖丟到群組裡,同事回了一排驚嘆號。
然後三個月後,沒有人在用。
這不是特定某個人的故事。這是 2026 年每天都在發生的事。
做的成本歸零,維護的成本一毛沒少
2026 年的數字已經很誇張了:92% 的美國開發者每天使用 AI coding tools,全球有 41% 的程式碼由 AI 生成。Andrej Karpathy 在 2025 年初的一則推文裡定義了 "vibe coding" -- 「完全交給 AI,擁抱指數成長,忘掉 code 的存在」。一年後,這已經不是推文裡的梗,而是多數開發者的日常。
AI 把「做」這件事的成本壓到了趨近於零。
但這裡有一件大家不太願意面對的事:AI 是放大器,不是方向盤。 它等比放大你做對的事,也等比放大你做錯的事。如果你原本就有想清楚再動手的習慣,AI 讓你快十倍交付。但如果你本來就有過度設計的傾向——想做的比需要的多、規劃的比驗證過的大——AI 會讓你用一個下午就把過度設計推到極致。以前,你的過度設計會在第三天撞上「寫不完」的現實而被迫收斂。現在那道牆消失了。
而它沒有降低另外三個成本:
維護成本。 AI 幫你三小時蓋好一棟房子,但物業管理費一毛沒少。每個月的水電瓦斯、漏水修繕、住戶投訴,都還是要人處理。而且因為蓋得太快,你連管線走哪都不太確定。那些你隨口跟 AI 說「加一個通知功能」「再加一個報表匯出」而生出來的模組,每一個都是未來的維護負債。
認知成本。 團隊裡的其他人要理解這坨東西。十幾個元件、各種狀態管理 -- 原作者可能都不完全記得每個函式在幹嘛,因為那是 AI 寫的。接手的人要花更多時間去逆向工程「這段邏輯為什麼是這樣」,而答案往往是「因為 AI 覺得這樣比較好」。Margaret-Anne Storey 把這種現象稱為 cognitive debt:「Technical debt lives in the codebase. Cognitive debt lives in the developer's head.」-- 當系統演化速度快於團隊更新心智模型的速度,認知債務就開始累積。
機會成本。 做這個,就沒在做更重要的事。一個下午聽起來很便宜,但後續的開發、測試、部署、維護加起來,可能是好幾個人週。而這幾個人週,本來可以拿去解決真正痛的問題。
生產力幻覺:你以為更快了,其實更忙了
這裡有一個反直覺的數據。
METR(Model Evaluation & Threat Research)在 2025 年做了一項嚴格的隨機對照實驗:讓資深工程師在他們自己熟悉的成熟 codebase 上用 AI 工具做維護工作。結果?平均慢了 19%。
不是新手。不是不熟悉的 codebase。是在自己的地盤上,用 AI 反而變慢。
2025 Stack Overflow Developer Survey 的數據同樣令人不安:近半數開發者表示,debug AI 產生的 code 比自己從頭寫還花時間。
CIO.com 的 〈The AI productivity trap: Why your best engineers are getting slower〉 把這個現象講得很到位:AI 工具製造了一種「生產力幻覺」(Productivity Illusion)-- 你覺得自己做了很多事,因為螢幕上確實出現了很多 code。但那些 code 需要被理解、被驗證、被整合進既有架構,而這些「隱藏工時」往往比省下的時間更長。
我們這個時代最弔詭的現象是:每個人都覺得自己的生產力提升了,但組織整體的交付速度並沒有對應加快。code 變多了,但完成的事情沒有變多。大家更忙了,但不是忙在解決問題,而是忙在管理 AI 幫你多生出來的那些東西。
生產不等於生產力。Output 不等於 outcome。
精緻度陷阱:漂亮的東西沒人捨得質疑
這才是我覺得最危險的地方。
如果有人拿出一張手繪草圖,上面歪歪扭扭畫了幾個方框,寫著「首頁」「管理」「報表」,你的第一反應一定是:「等等,我們真的需要這些嗎?」
但當他打開瀏覽器,展示一個有漸層色、有動畫過場、有假資料填充的精美介面時,你的大腦會不自覺地從「這該不該做」滑向「這裡的按鈕顏色要不要調深一點」。
一個漂亮的 prototype 是最危險的東西 -- 它讓所有人忘記問 why。
精緻度製造了一種完成感的幻覺。大家開始討論細節、討論排版、討論動畫 easing function,而不是退一步問:這個東西解決了什麼問題?現有的工具為什麼不能用?你用 AI 生了一個完整的專案管理系統,但你的團隊其實只需要一個 Google Sheet。你用 AI 做了一個客製化的知識庫,但大家根本沒離開過 Notion。
CodeRabbit 的研究分析了 470 個 GitHub PR,發現 AI co-authored code 出現重大問題的機率是人寫的 1.7 倍,安全漏洞率更高達 2.74 倍。精緻的表面下,藏著更多的地雷。但因為它看起來太完整了,沒有人會想到要去翻地毯下面。
我自己也不例外。上次我用 AI 花了兩小時做了一個「個人知識管理系統」的 prototype,功能完整到可以上架。然後我到現在都還在用 Notion。那兩個小時當下覺得很有生產力,事後想想,我只是很有效率地做了一件不需要做的事。沉沒成本謬誤在 AI 時代不但沒消失,反而因為產出速度太快而更容易觸發 -- 雖然 95% 是 AI 寫的,但那 5% 的 prompt engineering 和手動微調,感覺上就像是自己的作品。
Build 從三週變三小時,Maintain 仍然是三週每月
讓我把這個不對稱攤開來看。
在 AI 之前,你要做一個功能完整的內部系統 prototype,大概需要一個前端工程師花兩到三週。這個時間成本本身就是一道天然的品質閘門 -- 在你決定投入三週之前,你會認真想:這值得嗎?主管會問、PM 會問、你自己也會問。
現在,三小時。這道閘門消失了。
但維護端的時間沒有被壓縮。每個月的 bug fix、需求變更、相依套件更新、安全性修補,仍然是以「週」為單位計算的。而且因為 AI 生成的程式碼往往有一種「表面完整但深層脆弱」的特質 -- 跑得動,但你不確定為什麼跑得動 -- 維護成本搞不好還比手寫的更高。
這就像 AI 讓你免費拿到了一台超跑,但保險費、油錢、保養費、停車費都跟原價一樣。更麻煩的是,因為你沒花錢,車庫裡可能停了五台超跑,每台都在燒維護費。
The New Stack 在 〈From Vibes to Engineering〉 這篇文章裡指出:vibe coding 正在讓位給 agentic engineering -- 但在這個過渡期,最大的風險不是 AI 寫出爛 code,而是組織還沒建立起對應的治理機制。AI agent 可以一天生出十個 prototype,但誰來決定哪些該活、哪些該死?
我們正處在一個奇妙的時代:生產成本趨近於零,但管理成本正在爆炸。每個人都變成了一座小型軟體工廠,但整個組織沒有對應的品管流程。結果就是大家都很忙,倉庫裡堆滿了精美的半成品,但真正上線在用的系統還是那幾個老東西。
AI 沒有製造過度設計的問題——這個問題一直都在。工程師天生想多蓋一點,PM 天生想多要一點,老闆天生覺得「既然都做了不如多做一點」。以前,開發成本是唯一的制衡力量。現在 AI 把這個制衡拿掉了,過度設計就像失去煞車的車,一路狂飆到底。
那怎麼辦?
我不是說 AI 生 prototype 不好。恰恰相反,這是 AI 最強大的應用場景之一 -- 快速驗證想法、探索可能性、讓抽象的需求變成具象的畫面。
問題在於,我們需要在 AI 動手之前,重新建立那道被消滅的閘門。
我後來開始養成一個習慣:在掏出 AI 開始寫 code 之前,先回答三個問題:
- 這個工具服務多少人? 如果答案是個位數,那它的投資報酬率天花板就在那裡。
- 現有方案為什麼不行? 如果答不出具體的痛點,那多半不是「不行」,只是「不夠酷」。
- 誰負責維護? 如果沒有明確的 owner,這個 prototype 的最終命運就是躺在某個 repo 裡慢慢腐爛。
這三個問題聽起來很基本,但你會驚訝有多少 AI 生成的 prototype 連第一關都過不了。
我把這個概念叫做「需求殺手檢查表」,後來又加了幾個維度,目前在內部試跑。效果還不錯 -- 至少讓大家在「哇好酷」和「我們真的要做」之間,多了一個深呼吸的空間。
最後
AI 最大的風險不是取代人類,是讓人類更有效率地做不需要做的事。
下次你用 AI 三小時做出一個精美的 prototype,在你截圖丟群組之前,試著先問自己一句:
「如果這要手寫三週,我還會做嗎?」
如果答案是猶豫的,那你就知道了。
至於那份「需求殺手檢查表」的完整版 -- 包含評分機制和實戰案例 -- 我整理好再寫一篇。畢竟我自己也需要它。
引用來源:METR 2025 RCT、2025 Stack Overflow Developer Survey、CodeRabbit State of AI vs Human Code Generation、CIO.com — The AI Productivity Trap、Andrej Karpathy — Vibe Coding 定義、Margaret-Anne Storey — Cognitive Debt、The New Stack — From Vibes to Engineering