mk-brain

Agent 開發的下一波浪潮：從 Prompt 煉丹到可預測的工作流工程

當前 AI Agent 的開發仍高度依賴手動調整與昂貴的試錯，如同煉金術。一篇新研究指出，透過將 Agent 工作流視為計算圖，並利用圖神經網絡（GNN）預測其效能，我們正迎來一個新典範：可預測、可搜尋、可自動優化的「工作流工程」，這將是建構複雜 AI 系統的關鍵下一步。

江中喬

29 4月 2026 • 6 min read

過去幾年，我們見證了大型語言模型（LLM）能力的飛躍，從單純的文本生成，演進到能夠執行複雜任務的 AI Agent。然而，在興奮之餘，任何一位試圖建構實用 Agent 的開發者，都很快會撞上一面熟悉的牆：不確定性。

目前的 Agent 開發，很大程度上仍是一門「手藝」，而非「工程」。我們透過 ReAct、Tree of Thoughts 等框架設計出 Agent 的思考與行動流程，但要優化其表現，往往只能依賴大量的手工提示詞調整（prompt tuning）與反覆試錯。

每一次嘗試，都意味著昂貴的 API 呼叫與漫長的等待。整個過程充滿了直覺與運氣，與其說是科學，更像是中世紀的煉金術——我們知道目標，卻缺乏可預測、可複製的路徑。

我認為，這種「煉丹」式的開發模式，正是限制 Agent 技術大規模應用的核心瓶頸。我們需要的是一套更系統化、更具預測性的方法。最近一篇研究，為這個問題提出了一個極具潛力的工程化解決方案。

從「煉丹」到「工程」：Agent 工作流的挑戰

一個複雜的 Agent，其內部運作並非單一的 prompt-response 循環，而是一個由多個步驟、工具呼叫、資訊流動所組成的「工作流」（Workflow）。例如，一個研究助理 Agent 可能需要先搜尋資料、再摘要重點、接著交叉比對、最後生成報告。每一步都是一個節點，彼此串連成一張複雜的網絡。

問題在於，我們該如何設計這張網絡？是該先摘要再比對，還是同時進行？某個節點的提示詞稍作修改，會對最終結果產生多大的影響？這些問題的答案，目前只能透過暴力測試來回答。

這種開發方式不僅成本高昂，更重要的是它缺乏規模化的可能性。我們無法系統性地探索所有可能的工作流組合，也無法保證找到的「最佳實踐」在面對新任務時依然有效。

我們真正需要的，是將優化的重心從單一的「提示詞」轉移到整個「工作流架構」。這需要我們有能力在實際執行前，就評估一個工作流設計的優劣。

這正是工程化的核心精神：在投入大量資源之前，先進行模擬與預測。如果我們能預測一個 Agent 工作流的效能，就能從根本上改變遊戲規則。

將工作流視為「圖」：GNN 帶來的預測力

前述提到的研究，其核心洞見便是將 Agent 工作流抽象化為一個「計算圖」（Computational Graph）。在這個圖中，每個節點可以是一個 LLM 呼叫、一個工具、或是一個特定的提示詞模板；而節點之間的邊，則代表了資訊的流動方向。

一旦我們將工作流轉換為圖結構，就能運用專門處理圖形數據的強大工具——圖神經網絡（Graph Neural Networks, GNNs）。GNN 的特長在於能學習圖中節點與邊的複雜關係，從而捕捉到整個結構的內在特性。

研究團隊的做法是，先建立一個包含多種工作流設計及其對應實際效能的資料集（他們為此打造了 FLORA-Bench 平台），然後訓練一個 GNN 模型來學習「工作流結構」與「最終效能」之間的關聯。

實驗結果證明，這個方法非常有效。訓練完成的 GNN 能夠在不實際運行、不消耗任何 LLM API token 的情況下，僅僅透過分析工作流的「圖結構」，就準確預測出其可能的表現。這就像一位經驗豐富的架構師，只需看一眼建築藍圖，就能判斷出這棟建築是否穩固、動線是否流暢。

工作流自動優化：搜尋最佳 Agent 協作模式

擁有預測能力後，真正令人興奮的下一步便是「自動化優化」。當我們有了一個廉價且快速的效能預測器（GNN），我們就不再需要人工去猜測哪種設計更好。我們可以讓演算法在龐大的工作流設計空間中，自動進行搜尋與探索。

這個典範轉移，可以簡單歸納如下：

過去的模式：手工設計工作流 → 投入成本運行 → 評估結果 → 憑經驗修改並重複。
未來的模式：定義工作流的可能組合空間 → 使用 GNN 快速預測成千上萬種組合的效能 → 自動找出幾個最高分的候選設計 → 僅對這幾個最佳候選者進行實際驗證。

這意味著，Agent 的開發將從一門藝術，真正走向一門工程學科。我們將能系統性地設計、測試、並部署更可靠、更高效的 AI 系統。未來，我們討論的重點可能不再是某個 prompt 寫得多麼精妙，而是某個工作流架構為何在特定任務上能取得優異的表現，以及我們如何透過自動化工具找到它。

這條從手動到自動、從猜測到預測的道路，不僅會大幅降低開發成本，更將為建構能夠處理超複雜任務的多 Agent 協作系統，奠定穩固的工程基礎。

Agent 開發的下一波浪潮：從 Prompt 煉丹到可預測的工作流工程

江中喬

從「煉丹」到「工程」：Agent 工作流的挑戰

將工作流視為「圖」：GNN 帶來的預測力

工作流自動優化：搜尋最佳 Agent 協作模式

延伸閱讀

Sign up for more like this.