mk-brain

AI 系統的隱藏債務：我們是否問對了問題？

我們常專注於如何更快地找到答案，卻忽略了問題本身可能就是錯的。一篇關於科學發現自動化的新研究，揭示了「目標函數」才是 AI 系統設計中最容易被低估的環節，這對 Agent 系統的開發者尤其重要。

江中喬

10 6月 2026 • 6 min read

在追求更強大 AI 的競賽中，我們往往聚焦於模型的規模、訓練的速度與優化的效率。但一篇引人深思的論文提醒了我，真正的瓶頸或許不在於「如何更快地找到答案」，而在於我們是否「問對了問題」。這篇名為《以自主目標演化 Agent 加速科學發現》的研究，不僅為材料科學、藥物開發等領域帶來啟發，更直接點出了當前 Agent 系統設計的核心挑戰：真正稀缺的不是更快的優化器，而是能否為複雜問題定義出一個真正有意義的目標函數。這層思考，正是區分一個平庸系統與一個能帶來突破性價值的系統的關鍵。

我們擅長爬山，但如何確定哪座山是對的？

過去十年，AI 在特定領域的優化問題上取得了驚人成就。從 AlphaFold 2 精準預測蛋白質結構，到各種運用強化學習尋找最佳化學合成路徑的研究，我們打造了許多性能強大的「爬山演算法」。只要給定一個清晰的山頂（目標函數），例如「最高的蛋白質結構預測準確率」或「最短的反應路徑」，AI 就能高效地找到通往山頂的路。

然而，現實世界的挑戰遠比爬一座定義好的山要複雜。在藥物開發中，我們想要的不是單純「與靶點結合力最強」的分子，而是一個兼具高活性、低毒性、高穩定性、易於合成且不易產生抗藥性的分子。這是一個典型的多目標優化（Multi-objective optimization）問題。傳統作法是將這些目標加權整合成一個單一的目標函數，但權重的設定本身就是一門藝術，甚至帶有偏見。我們很可能因為錯誤或不完整的目標定義，而讓強大的 AI 在一座錯誤的山上奮力登頂。

SAGA 如何解決「問錯問題」的困境？

這篇提交於 2025 年 12 月的論文（arXiv:2512.21782）提出了一個名為 SAGA（Scientific Autonomous Goal-evolving Agent）的框架，其核心思想相當優雅：讓 AI 不只會找答案，還要學會自己「演化」問題。

SAGA 採用了一個雙層迴路架構：

內環（Inner Loop）：優化器。 這一層負責傳統的任務。給定一個明確的目標函數（例如：尋找一種對特定細菌具有 >95% 殺傷力且毒性低於某個閾值的化合物），它會利用現有的機器學習模型或演算法，快速生成一批候選方案。
外環（Outer Loop）：目標演化器。 這是 SAGA 的精髓。它會評估內環產出的結果，並根據這些結果、領域知識（可能來自大型語言模型對科學文獻的理解）以及過去的成功與失敗經驗，來「修改」或「演化」目標函數本身。

舉例來說，在尋找新抗生素的任務中，外環可能會發現，僅僅追求高殺菌力的候選藥物，往往也伴隨著對人體細胞的高毒性。於是，它會自動在下一輪的目標函數中，加入一個更嚴格的「選擇性指數」（對細菌的毒性 vs. 對人體細胞的毒性）作為新的優化方向。這種動態調整目標的能力，讓整個發現過程從單純的「爬山」變成了更智慧的「探路」——在廣闊的可能性空間中，不斷尋找並定義出更有價值的「山」。

這完美體現了古德哈特定律（Goodhart's Law）的智慧：「當一個指標成為目標時，它就不再是一個好的指標。」SAGA 的設計，正是在系統層級上應對這個挑戰的嘗試。

SAGA 對 Agent 系統建構者有何啟示？

SAGA 框架雖然應用於科學發現，但其核心哲學對正在建構多 Agent 系統或自主系統的我們，具有更廣泛的實務意義。我們時常過度專注於 Agent 執行任務的能力（內環），卻忽略了賦予它任務的「目標設定」本身（外環）才是最脆弱、也最容易產生非預期後果的地方。

一個只被告知「最大化點擊率」的廣告投放 Agent，可能會為了達成目標而犧牲使用者體驗；一個只被要求「最快完成任務」的自主工作流 Agent，可能會選擇抄捷徑而忽略品質與安全。這些都是目標函數定義不完整的後果。

從 SAGA 的設計中，我們可以得到幾點啟發：

分層思考目標： 將單一、僵化的目標，拆解成一個包含主要目標、硬性約束、軟性偏好（nice-to-haves）的目標體系。
建立目標回饋迴路： 系統的產出不應只用來評估「方案」的好壞，更應該用來反思「目標」的合理性。這個迴路可以是全自動的，也可以是「人在迴路中」（Human-in-the-Loop）的，由領域專家定期介入調整。
將目標演化視為核心能力： 一個真正智慧的 Agent，不應該只是指令的忠實執行者，更應該是目標的協作者。它需要具備一定程度的「常識」與「價值判斷」，在發現目標與現實情況衝突時，能夠提出疑問或建議修正。這或許是未來大型語言模型 Agent 發展的重要方向之一。

從這篇論文的 v1（2025 年 12 月）到 v2（2026 年 3 月）的修訂，可以看出研究團隊也在不斷精煉這個框架。它提醒我們，在 AI 技術飛速發展的今天，與其無止盡地追求更快的速度，不如花更多心力在定義「方向」上。畢竟，用超跑的速度開往錯誤的目的地，只會讓我們更快地失敗。設計出能夠自我修正、演化目標的系統，才是通往更通用、更可靠人工智慧的必經之路。

延伸閱讀

我是江中喬，一位具有 TPM 與產品管理背景的 AI 系統建構者，目前專注於 AI 認知增強系統與多 Agent 協作架構的設計與實踐。

我們擅長爬山，但如何確定哪座山是對的？

SAGA 如何解決「問錯問題」的困境？

SAGA 對 Agent 系統建構者有何啟示？

延伸閱讀

Sign up for more like this.