指揮 Claude Code 打大型戰:把它當成「CEO + 工程師 + QA」的接力賽

大型複雜任務不是靠更長的 prompt,而是靠工作流治理:介面先於實作、分身接力而非平行亂改、每段都要有可驗證的證據,再加上標準化交接包,讓 Claude Code 像一個可控的團隊而不是全能聊天機器人。

指揮 Claude Code 打大型戰:把它當成「CEO + 工程師 + QA」的接力賽

指揮 Claude Code 打大型戰:把它當成「CEO + 工程師 + QA」的接力賽,而不是一個全能聊天機器人

你有沒有遇過這種狀況:

  • Claude Code 很自信說「完成了 ✅」

  • 你一跑測試,紅到像聖誕樹

  • 你回頭看才發現:它不是不會寫,而是從一開始就「理解錯」

我對這件事的看法一直很簡單:大型複雜任務不是靠更長的 prompt 解決,而是靠更好的工作流治理。

最近看到一篇實戰文(講怎麼指揮 Claude Code 用少量時間處理大型複雜任務),我覺得方向很對:

把 Claude Code 當成一個「會分身的組織」,你要做的是設計角色與交接,而不是陪它一路腦補。

https://blog.ray-realms.com/command-claude-code-to-conquer-complex-tasks/

我用自己的語氣把重點整理一次,順便補上我覺得更可落地的地方。


## 先講結論:大型任務有三座山,分別要用三種機制壓住

### 1) 上下文管理(context 爆炸)
當任務大到超過模型的舒適區,你塞再多資料進去,它也不會更聰明,只會更分心。

解法不是「放更多」,而是「切更乾淨」。

### 2) 一步錯、步步錯(目標偏移)
大型任務最可怕的是:你讓它跑了 30 分鐘,最後才發現方向歪了。

解法是「每段都可驗證」,不接受一次交付一大包。

### 3) 狀態追蹤與錯誤恢復(交接失真)
多階段、多 agent 會讓上下文彼此分離,但也會帶來新的問題:交接不清楚就會累積技術債。

解法是「標準化交接包」,讓下一棒不用通靈。


## 把 Claude Code 當成「CEO + 分工工程師 + QA」

Ray 的核心做法我很喜歡:讓 Claude Code 擔任 CEO,然後召喚 Sub-Agents(分身)去做不同階段。

這個比喻其實很貼近真實專案:

  • CEO 不需要寫每一行 code,但要負責「拆任務、排順序、控風險」

  • 工程師不需要懂全局,只要把自己那一段交付好

  • QA 不需要討論願景,只要確認「有沒有符合合約」

你在做的不是“找一個更聰明的模型”,而是“設計一間比較不會出事的公司”。


## 1)先解耦:介面先於實作(Interface-first)

大型任務最常見的災難是耦合:

  • 後端寫了一套 API

  • 前端用另一套方式 call

  • 最後兩邊都很努力,但就是接不起來

所以我很認同「預備階段」:

  • 先派一個 Agent 定契約(API 文件 / schema / error policy)

  • 後續前後端/不同子任務全部照契約施工

這一步的價值是:你把「對齊」提前做完,後面才有資格平行/分工。

定契約不是慢,是把未來的返工提早一次做掉。


## 2)再接力:一次只讓一個人改同一個地方

Ray 提到一個很反直覺但很重要的點:

分身可以很多,但一次只讓一個分身真的動手。

理由很現實:

  • 兩個 agent 同時改同一個檔案,衝突/覆蓋是必然

  • 大型任務的風險不是「跑得慢」,是「錯得很安靜」

所以比較穩的方式是接力賽:

  • 一次只交付一個階段

  • 階段完成 → 交接包 + 驗證證據 → 才交棒給下一位

這會讓你的人類監督成本下降,因為你只需要逐段檢查,不用一次看一個混雜的 commit 大包。


## 3)再加 QA:每個階段後都要有「證據」

我非常同意「每個階段都要加 QA Agent」。

但我會把 QA 的任務說得更硬一點:

  • 沒有證據,不算完成。

這裡的證據,最好是可機器驗證:

  • tests(unit / integration / e2e)

  • typecheck / lint / build

  • schema validation

我也建議加一條規則:

  • 不接受「手動測試說明」當成驗收

不是因為手動測試沒用,而是因為你在做長流程接力賽,手動測試很難被下一棒信任、也很難被重複。


## 我會補一個更可落地的「交接包」模板

很多 multi-agent 流程會失敗,不是因為寫不出來,而是交接時資訊失真。

我會強制每一段產出一份交接包(很短也沒關係):

  • What changed:改了什麼(檔案/模組/介面)

  • Why:為什麼這樣改(trade-off / 假設)

  • How to verify:怎麼驗證(指令/測試/預期結果)

  • Known risks:目前知道的風險與未處理事項

  • Next step:下一棒要做什麼(含依賴)

這份交接包,不只讓下一個 agent 少猜,也讓你這個人類更容易接管。


## 一句話的收尾:你要做的不是寫 prompt,而是做治理

「vibe-coding」可以是起點,但大型任務需要的是:

  • 合約(contract)

  • 脈絡(context)

  • 證據(evidence)

  • 交接(handoff)

把這四個東西做對,模型不需要完美,你的交付也會變得可靠。


#AI #ClaudeCode #CodingAgents #SDD #ContextEngineering #軟體工程