我為 AI 多 Agent 協作寫了一部憲法
當你的 AI Agent 們開始互相矛盾、決策散落在 20 個對話裡找不到,你需要的不是更好的 prompt — 你需要一部憲法。
問題:多 Agent 協作的治理真空
2026 年,用多個 AI Agent 協作開發已經不稀奇。我日常的工作流是四個 Agent 同時運作:
- Claude 當總指揮,負責架構和任務拆解
- Codex 負責實作和 code review
- Perplexity 負責外部知識查詢
- Gemini 當備用的長 context 分析
我把這套叫做「四位一體模式」,跑了一陣子之後,撞到三個問題:
1. 決策散落在對話裡
「上次為什麼選了 Redis 不用 Memcached?」我記得討論過,但在哪個 session?跟哪個 Agent 討論的?找不到了。每個 AI 對話都是 ephemeral 的,session 結束就消失。
2. 沒有風險分級
改一個 README 跟改一個 database schema,在流程上沒有區別 — 都是「跟 AI 討論完就做了」。但這兩件事的風險等級天差地遠。
3. 沒有異議機制
AI 天生傾向附和。你說要用方案 A,它就幫你做方案 A。沒有人跳出來說:「等等,你考慮過方案 A 掛掉的時候怎麼辦嗎?」
這三個問題的根源是一樣的:我的多 Agent 協作缺乏制度化治理。
解法:Civilization Model
靈感來自一個簡單的類比:一群人要長期合作,最終都會發展出制度。從部落到國家,制度的核心就是:誰能做什麼決定、怎麼做、做完記在哪裡。
AI Agent 的協作也一樣。我需要的不是更好的 prompt engineering,是一套治理架構。
我把它叫做 Unified Knowledge Civilization Model — 統一知識文明模型。
五層架構
Layer 5 CIVILIZATION MODEL — 憲法層
Layer 4 COUNCIL PROTOCOL — 程序正義層
Layer 3 FOUR-AGENT ENGINE — 運作引擎
Layer 2 MEMORY GATEWAY — 記憶閘道
Layer 1 SURVIVABILITY LAYERS — 存續層
上層約束下層。這是最重要的原則。
Layer 5(憲法層) 定義不可違反的治理原則:記憶屬於制度不屬於個人、治理規則優先於便利性。
Layer 4(程序正義層) 定義決策流程:什麼時候需要升級審議、提案要包含什麼、什麼時候需要異議。
Layer 3(運作引擎) 就是原本的四位一體 — Claude 指揮、Codex 實作、Perplexity 查詢、Gemini 備用。但現在它受到上面兩層的約束。
Layer 2(記憶閘道) 定義知識怎麼進入長期記憶:不是所有對話都值得保存,只有經過審議和批准的決策才能進入。
Layer 1(存續層) 確保即使主要操作者(我)不在,核心知識仍然可讀。
核心機制:強制升級 + 強制異議
這套架構最有價值的是兩個「強制」:
強制升級觸發:當以下任一條件成立時,不能直接執行,必須進入 Council 審議流程。
- 風險等級 >= High
- 不可逆的基礎設施變更
- Schema 修改
- 長期記憶 commit
- 影響超過一個系統邊界
強制異議:High 和 Critical 等級的決策,至少需要一個異議聲音 — 可以是反提案、風險備忘錄、或證據挑戰。沒有異議?那這個決策就被 BLOCK,不能通過。
這聽起來很官僚?其實不會。Low 和 Medium 風險的日常操作完全不受影響,自動通過。只有真正重要的決策才會觸發完整流程。
風險怎麼判定?
我設計了一個簡單的 triage checklist:
| 判定為 High | 判定為 Critical |
|---|---|
| 影響基礎設施組件 | 不可逆操作 |
| 改動 schema | 潛在資料遺失 |
| 影響長期記憶 | 治理結構修改 |
| 修改外部介面 | 金流或資安影響 |
任一成立就升級。初判由 Claude(Architect 角色)提出,其他 Agent 可以挑戰。
最小可運行的 Memory Gateway
治理架構再完美,沒有落地就是空談。我的原則是:先用最小可運行版本驗證流程,再決定要不要加基礎設施。
Memory Gateway 的最小實作就是三個 Markdown 檔案:
~/.claude/mem/
├── staging.md ← 暫存區:所有候選決策先進這裡
├── decisions.md ← 文明記憶:只有批准的決策可進入
└── experiments.md ← 實驗紀錄:postmortem 和驗證結果
staging.md — 暫存區
所有 High/Critical 決策必須先進入 staging,帶完整的 metadata:
id: STG-001
type: governance
risk_level: critical
source_issue_id: CIVILIZATION-v1.1
created_by: Chair + Claude (Architect)
timestamp: 2026-02-17
review_date: 2026-03-17
validation_status: pending
rollback_plan: Revert CLAUDE.md + remove ~/.claude/mem/
加上 Proposal Contract:假設、證據、風險、取捨、回滾計畫。
decisions.md — 文明記憶
只有經過驗證和批准(Chair ratification)的決策才能從 staging 搬到這裡。這是你的制度記憶 — 不是對話紀錄,是結構化的決策。
experiments.md — 實驗紀錄
每個決策都有 review date。到期時回頭驗證:假設對嗎?結果如預期嗎?有偏差嗎?行動是 Keep / Adjust / Rollback。
Pipeline 操作流程
對話 (Arena)
↓ 觸發升級條件
Staging(寫入 staging.md)
↓ Council 驗證:風險分級、合約完整性、異議
Commit(搬到 decisions.md)
↓ 到達 review date
Review(結果寫入 experiments.md)
日常對話是 Arena,是暫時的。只有被批准的決策才進入文明記憶。 這個區分至關重要。
第一筆決策:吃自己的狗糧
建立這套架構本身就是一個 Critical 等級的治理變更。所以我們用這套流程來批准這套流程 — 吃自己的狗糧。
- Claude(Architect)提出 STG-001:採用 Civilization Model
- Claude 自提 risk memo 作為異議:「主要風險是官僚開銷拖慢日常開發」
- 緩解方案:Low/Medium 風險自動通過,不走 Council
- Chair(我)審查完整 Proposal Contract 後批准
- STG-001 從 staging.md 移入 decisions.md,成為 DEC-001
- Review date 設為 30 天後
整個流程花不到 30 分鐘。這證明了這套制度的開銷是可控的。
為什麼你可能也需要這個
如果你正在用多個 AI Agent 協作(不管是 Claude + Copilot、或任何組合),問自己三個問題:
- 你能找到三個月前的 AI 協作決策嗎? 不是找到對話紀錄,是找到「為什麼做了這個決定」。
- 改一個 config 和改一個 database schema,你的流程一樣嗎? 如果一樣,你缺少風險分級。
- 你的 AI 有沒有跟你說過「不」? 如果從來沒有,你缺少異議機制。
如果三題都中,你不需要照搬我的整套架構,但你需要開始思考治理。
完整模板
以下是最小可運行版本的完整結構,歡迎直接複製改用:
你的設定目錄/
├── CLAUDE.md(或你的 AI 設定檔)
│ └── 加入:Civilization Stack 層級、Escalation Triggers、Risk Triage
└── mem/
├── staging.md ← 候選決策暫存
├── decisions.md ← 批准的制度記憶
└── experiments.md ← 實驗與 postmortem
staging.md 的 entry template:
id:
type: decision | experiment | principle | infra | governance
risk_level: low | medium | high | critical
source_issue_id:
created_by:
timestamp:
review_date:
validation_status: pending
rollback_plan:
寫在最後
新加坡在 2026 年 1 月發布了全球第一個 Agentic AI 治理框架,那是給企業和政府用的。但個人開發者和小團隊的 multi-agent 協作,沒有人在談治理。
我們用 AI 寫的 code 越來越多,做的決策越來越依賴 AI,但管理這些決策的方式還停留在「對話完就忘了」。
文明的起點不是技術突破,是開始有制度。 你的 AI 協作也是。
用到的工具:Claude Code(Architect)、Codex(Engineering)、Perplexity(Research)、ChatGPT(Civilization Model 共同設計)
完整的 Civilization Architecture 文件可以在 GitHub 找到。