mk-brain

Google 的 Agent Skills：AI Agent 的下一步不是更大的 Prompt，而是可組裝的技能庫

AI Agent 的能力瓶頸，你還在想著擴大 Prompt 或上下文視窗嗎？Google 開源的 Agent Skills 專案，正預告著一場典範轉移：未來不再是靠「煉丹」般的提示詞工程，而是將複雜任務模組化為可組裝、可版本化的技能，讓 AI 系統更穩定、更具擴展性。這不僅是技術選擇，更是軟體工程思維的勝利。

江中喬

16 5月 2026 • 6 min read

最近，當我們談論如何增強 AI Agent 的能力時，直覺反應往往是擴大模型的上下文視窗（Context Window）或設計更精巧的提示（Prompt）。然而，Google 最近開源的 google/skills 專案，明確地指向了另一個更具擴展性與工程思維的方向：Agent 的下一層抽象不是更多的 prompt，而是可組裝、可版本化、可重用的技能模組。

真正重要的是將能力封裝成穩定介面，而不是把所有知識都塞進上下文。這個轉變不僅是技術路徑的選擇，更是思維模式的根本變革。它意味著我們開始將 AI Agent 的建構，從一種接近「煉丹」的藝術，轉變為一門更接近軟體開發的嚴謹工程。這也是我認為 AI 應用要從概念驗證（PoC）走向大規模產品化，所必須跨越的鴻溝。

為什麼我們需要「技能」而不是更長的 Prompt？

長期以來，許多 Agent 框架都圍繞著「In-Context Learning」建構，試圖將所有必要的資訊、工具說明、範例都塞進模型的上下文視窗。這種作法的優點是快速靈活，但隨著 Agent 任務複雜度的提升，其缺點也日益明顯：

脆弱且不穩定：一個微小的提示詞修改，就可能導致 Agent 行為出現無法預期的巨大變化。這種「蝴蝶效應」讓系統的可靠性大打折扣。
成本高昂：每一輪對話都需要傳遞龐大的上下文，這直接轉化為高昂的 Token 運算成本與延遲，難以規模化。
難以維護與迭代：當所有邏輯都糾纏在一個巨大的 Prompt 模板中時，新增功能、修復錯誤或進行版本控制都變得極其困難，團隊協作也充滿挑戰。

相對地，「技能模組化」的思路借鑒了現代軟體工程的核心原則。就像我們不會把所有程式碼都寫在一個 main 函式裡，而是將其拆分為獨立的函式、類別與函式庫一樣，Agent Skills 也是將特定的能力封裝起來，提供一個穩定、清晰的 API 介面供 Agent 調用。

模組化思維：從「煉丹」到嚴謹工程

這個介面（技能的名稱、參數、回傳值）是固定的，而內部的實作細節（無論是呼叫雲端服務 API、執行一段程式碼、或甚至是另一個小型 LLM）則可以獨立更新、測試與版本化，而不影響調用它的 Agent。

Google 的「Agent Skills」到底是什麼？

Google 在官方部落格中發布的這個 Agent Skills 專案，正是上述理念的具體實踐。它是一個開源的技能庫，旨在為基於 Gemini API 或其他模型的 AI Agent 提供與 Google 產品和技術互動的標準化工具。截至 2026 年 5 月中，這個專案在 GitHub 上已經累積了超過 8,400 顆星，顯示了開發者社群對此方向的高度興趣。

目前，這個技能庫涵蓋了對 Google Cloud 基礎設施的核心操作，例如：

查詢 BigQuery 資料集
管理 Google Kubernetes Engine (GKE) 叢集
操作 Cloud Storage 物件

這些技能遵循 Apache-2.0 授權，並提供了一個簡單的 `skills.sh` 腳本供開發者安裝。

與 Google 生態系的深度整合

更重要的是，這些技能並非孤立存在，而是 Google 整個 Agent 開發生態系的一環。它們可以與 Agent Development Kit (ADK) 緊密結合，並在 Vertex AI Agent Engine 這樣的企業級平台上部署與管理，形成從開發、測試到部署的完整工作流程。

這對開發者和產品實踐意味著什麼？

將基礎設施與服務「技能化」，對開發者與產品團隊而言，帶來了幾個顯著的價值。

降低開發門檻，專注核心邏輯

首先，它大幅降低了建構複雜 Agent 的門檻。開發者不再需要為每一個 Google Cloud 服務手動撰寫繁瑣的 API 呼叫邏輯與詳細的 Prompt 說明，而是可以直接取用這些經過官方驗證、可信賴的技能模組，將精力更專注於 Agent 的核心業務邏輯與流程編排。

這代表我們終於開始用軟體工程的紀律來對待 Agent 開發，從「提示詞手工業」邁向「能力元件化」的時代。

提升穩定性與可預測性

其次，這提升了 Agent 的穩定性與可預測性。當 Agent 需要查詢資料庫時，它調用的是一個版本化的 `bigquery.query` 技能，而不是靠自然語言理解去猜測如何生成 SQL。

這使得 Agent 的行為更容易除錯、測試與監控。當 BigQuery 的底層 API 更新時，我們只需要更新技能本身，而上層的 Agent 邏輯可以保持不變。

加速企業 AI 落地與能力資產化

最終，這將加速 AI Agent 在企業內部的實作落地。一個可重用、可組合的技能市集，讓不同團隊可以共享彼此開發的能力，避免重複造輪子，並逐步建立起整個組織的「AI 能力資產庫」。

這不僅是技術上的演進，更是組織協作模式的升級。

總結來說，Google 的 Agent Skills 專案雖然還在早期階段，但它所揭示的趨勢至關重要。AI Agent 的未來，將由一個個堅實、可靠、可組合的「能力積木」所構成，而不是一個巨大而脆弱的「提示詞城堡」。