AI 系統的隱藏債務:我們是否問對了問題?
我們常專注於如何更快地找到答案,卻忽略了問題本身可能就是錯的。一篇關於科學發現自動化的新研究,揭示了「目標函數」才是 AI 系統設計中最容易被低估的環節,這對 Agent 系統的開發者尤其重要。
在追求更強大 AI 的競賽中,我們往往聚焦於模型的規模、訓練的速度與優化的效率。但一篇引人深思的論文提醒了我,真正的瓶頸或許不在於「如何更快地找到答案」,而在於我們是否「問對了問題」。這篇名為《以自主目標演化 Agent 加速科學發現》的研究,不僅為材料科學、藥物開發等領域帶來啟發,更直接點出了當前 Agent 系統設計的核心挑戰:真正稀缺的不是更快的優化器,而是能否為複雜問題定義出一個真正有意義的目標函數。這層思考,正是區分一個平庸系統與一個能帶來突破性價值的系統的關鍵。
我們擅長爬山,但如何確定哪座山是對的?
過去十年,AI 在特定領域的優化問題上取得了驚人成就。從 AlphaFold 2 精準預測蛋白質結構,到各種運用強化學習尋找最佳化學合成路徑的研究,我們打造了許多性能強大的「爬山演算法」。只要給定一個清晰的山頂(目標函數),例如「最高的蛋白質結構預測準確率」或「最短的反應路徑」,AI 就能高效地找到通往山頂的路。
然而,現實世界的挑戰遠比爬一座定義好的山要複雜。在藥物開發中,我們想要的不是單純「與靶點結合力最強」的分子,而是一個兼具高活性、低毒性、高穩定性、易於合成且不易產生抗藥性的分子。這是一個典型的多目標優化(Multi-objective optimization)問題。傳統作法是將這些目標加權整合成一個單一的目標函數,但權重的設定本身就是一門藝術,甚至帶有偏見。我們很可能因為錯誤或不完整的目標定義,而讓強大的 AI 在一座錯誤的山上奮力登頂。
SAGA 如何解決「問錯問題」的困境?
這篇提交於 2025 年 12 月的論文(arXiv:2512.21782)提出了一個名為 SAGA(Scientific Autonomous Goal-evolving Agent)的框架,其核心思想相當優雅:讓 AI 不只會找答案,還要學會自己「演化」問題。
SAGA 採用了一個雙層迴路架構:
- 內環(Inner Loop):優化器。 這一層負責傳統的任務。給定一個明確的目標函數(例如:尋找一種對特定細菌具有 >95% 殺傷力且毒性低於某個閾值的化合物),它會利用現有的機器學習模型或演算法,快速生成一批候選方案。
- 外環(Outer Loop):目標演化器。 這是 SAGA 的精髓。它會評估內環產出的結果,並根據這些結果、領域知識(可能來自大型語言模型對科學文獻的理解)以及過去的成功與失敗經驗,來「修改」或「演化」目標函數本身。
舉例來說,在尋找新抗生素的任務中,外環可能會發現,僅僅追求高殺菌力的候選藥物,往往也伴隨著對人體細胞的高毒性。於是,它會自動在下一輪的目標函數中,加入一個更嚴格的「選擇性指數」(對細菌的毒性 vs. 對人體細胞的毒性)作為新的優化方向。這種動態調整目標的能力,讓整個發現過程從單純的「爬山」變成了更智慧的「探路」——在廣闊的可能性空間中,不斷尋找並定義出更有價值的「山」。
這完美體現了古德哈特定律(Goodhart's Law)的智慧:「當一個指標成為目標時,它就不再是一個好的指標。」SAGA 的設計,正是在系統層級上應對這個挑戰的嘗試。
SAGA 對 Agent 系統建構者有何啟示?
SAGA 框架雖然應用於科學發現,但其核心哲學對正在建構多 Agent 系統或自主系統的我們,具有更廣泛的實務意義。我們時常過度專注於 Agent 執行任務的能力(內環),卻忽略了賦予它任務的「目標設定」本身(外環)才是最脆弱、也最容易產生非預期後果的地方。
一個只被告知「最大化點擊率」的廣告投放 Agent,可能會為了達成目標而犧牲使用者體驗;一個只被要求「最快完成任務」的自主工作流 Agent,可能會選擇抄捷徑而忽略品質與安全。這些都是目標函數定義不完整的後果。
從 SAGA 的設計中,我們可以得到幾點啟發:
- 分層思考目標: 將單一、僵化的目標,拆解成一個包含主要目標、硬性約束、軟性偏好(nice-to-haves)的目標體系。
- 建立目標回饋迴路: 系統的產出不應只用來評估「方案」的好壞,更應該用來反思「目標」的合理性。這個迴路可以是全自動的,也可以是「人在迴路中」(Human-in-the-Loop)的,由領域專家定期介入調整。
- 將目標演化視為核心能力: 一個真正智慧的 Agent,不應該只是指令的忠實執行者,更應該是目標的協作者。它需要具備一定程度的「常識」與「價值判斷」,在發現目標與現實情況衝突時,能夠提出疑問或建議修正。這或許是未來大型語言模型 Agent 發展的重要方向之一。
從這篇論文的 v1(2025 年 12 月)到 v2(2026 年 3 月)的修訂,可以看出研究團隊也在不斷精煉這個框架。它提醒我們,在 AI 技術飛速發展的今天,與其無止盡地追求更快的速度,不如花更多心力在定義「方向」上。畢竟,用超跑的速度開往錯誤的目的地,只會讓我們更快地失敗。設計出能夠自我修正、演化目標的系統,才是通往更通用、更可靠人工智慧的必經之路。
延伸閱讀
- Accelerating Scientific Discovery with Autonomous Goal-evolving Agents
- Highly accurate protein structure prediction with AlphaFold
- Evolutionary algorithm - Wikipedia
我是江中喬,一位具有 TPM 與產品管理背景的 AI 系統建構者,目前專注於 AI 認知增強系統與多 Agent 協作架構的設計與實踐。