Agent 開發的下一波浪潮:從 Prompt 煉丹到可預測的工作流工程

當前 AI Agent 的開發仍高度依賴手動調整與昂貴的試錯,如同煉金術。一篇新研究指出,透過將 Agent 工作流視為計算圖,並利用圖神經網絡(GNN)預測其效能,我們正迎來一個新典範:可預測、可搜尋、可自動優化的「工作流工程」,這將是建構複雜 AI 系統的關鍵下一步。

Agent 開發的下一波浪潮:從 Prompt 煉丹到可預測的工作流工程

過去幾年,我們見證了大型語言模型(LLM)能力的飛躍,從單純的文本生成,演進到能夠執行複雜任務的 AI Agent。然而,在興奮之餘,任何一位試圖建構實用 Agent 的開發者,都很快會撞上一面熟悉的牆:不確定性。

目前的 Agent 開發,很大程度上仍是一門「手藝」,而非「工程」。我們透過 ReAct、Tree of Thoughts 等框架設計出 Agent 的思考與行動流程,但要優化其表現,往往只能依賴大量的手工提示詞調整(prompt tuning)與反覆試錯。

每一次嘗試,都意味著昂貴的 API 呼叫與漫長的等待。整個過程充滿了直覺與運氣,與其說是科學,更像是中世紀的煉金術——我們知道目標,卻缺乏可預測、可複製的路徑。

我認為,這種「煉丹」式的開發模式,正是限制 Agent 技術大規模應用的核心瓶頸。我們需要的是一套更系統化、更具預測性的方法。最近一篇研究,為這個問題提出了一個極具潛力的工程化解決方案。

從「煉丹」到「工程」:Agent 工作流的挑戰

一個複雜的 Agent,其內部運作並非單一的 prompt-response 循環,而是一個由多個步驟、工具呼叫、資訊流動所組成的「工作流」(Workflow)。例如,一個研究助理 Agent 可能需要先搜尋資料、再摘要重點、接著交叉比對、最後生成報告。每一步都是一個節點,彼此串連成一張複雜的網絡。

問題在於,我們該如何設計這張網絡?是該先摘要再比對,還是同時進行?某個節點的提示詞稍作修改,會對最終結果產生多大的影響?這些問題的答案,目前只能透過暴力測試來回答。

這種開發方式不僅成本高昂,更重要的是它缺乏規模化的可能性。我們無法系統性地探索所有可能的工作流組合,也無法保證找到的「最佳實踐」在面對新任務時依然有效。

我們真正需要的,是將優化的重心從單一的「提示詞」轉移到整個「工作流架構」。這需要我們有能力在實際執行前,就評估一個工作流設計的優劣。

這正是工程化的核心精神:在投入大量資源之前,先進行模擬與預測。如果我們能預測一個 Agent 工作流的效能,就能從根本上改變遊戲規則。

將工作流視為「圖」:GNN 帶來的預測力

前述提到的研究,其核心洞見便是將 Agent 工作流抽象化為一個「計算圖」(Computational Graph)。在這個圖中,每個節點可以是一個 LLM 呼叫、一個工具、或是一個特定的提示詞模板;而節點之間的邊,則代表了資訊的流動方向。

一旦我們將工作流轉換為圖結構,就能運用專門處理圖形數據的強大工具——圖神經網絡(Graph Neural Networks, GNNs)。GNN 的特長在於能學習圖中節點與邊的複雜關係,從而捕捉到整個結構的內在特性。

研究團隊的做法是,先建立一個包含多種工作流設計及其對應實際效能的資料集(他們為此打造了 FLORA-Bench 平台),然後訓練一個 GNN 模型來學習「工作流結構」與「最終效能」之間的關聯。

實驗結果證明,這個方法非常有效。訓練完成的 GNN 能夠在不實際運行、不消耗任何 LLM API token 的情況下,僅僅透過分析工作流的「圖結構」,就準確預測出其可能的表現。這就像一位經驗豐富的架構師,只需看一眼建築藍圖,就能判斷出這棟建築是否穩固、動線是否流暢。

工作流自動優化:搜尋最佳 Agent 協作模式

擁有預測能力後,真正令人興奮的下一步便是「自動化優化」。當我們有了一個廉價且快速的效能預測器(GNN),我們就不再需要人工去猜測哪種設計更好。我們可以讓演算法在龐大的工作流設計空間中,自動進行搜尋與探索。

這個典範轉移,可以簡單歸納如下:

  • 過去的模式:手工設計工作流 → 投入成本運行 → 評估結果 → 憑經驗修改並重複。
  • 未來的模式:定義工作流的可能組合空間 → 使用 GNN 快速預測成千上萬種組合的效能 → 自動找出幾個最高分的候選設計 → 僅對這幾個最佳候選者進行實際驗證。

這意味著,Agent 的開發將從一門藝術,真正走向一門工程學科。我們將能系統性地設計、測試、並部署更可靠、更高效的 AI 系統。未來,我們討論的重點可能不再是某個 prompt 寫得多麼精妙,而是某個工作流架構為何在特定任務上能取得優異的表現,以及我們如何透過自動化工具找到它。

這條從手動到自動、從猜測到預測的道路,不僅會大幅降低開發成本,更將為建構能夠處理超複雜任務的多 Agent 協作系統,奠定穩固的工程基礎。

延伸閱讀

我是江中喬,一位具有 TPM 與產品管理背景的 AI 系統建構者,目前專注於 AI 認知增強系統與多 Agent 協作架構的設計與實踐。