mk-brain

從工具串接到可信系統：MCP 如何為高風險領域的 LLM 賦予可驗證的專業能力

大型語言模型在法律、稅務等高風險領域的應用，最大挑戰是幻覺與缺乏可驗證性。一個日本開發者的專案，透過 MCP 協定標準化官方數據接口，展示了如何從簡單的工具串接，走向真正可信賴的 AI 系統。這不僅是技術實踐，更是對未來專業 AI 系統架構的深刻啟示。

江中喬

24 5月 2026 • 6 min read

大型語言模型（LLM）在高風險專業領域，如法律、金融或醫療的應用，面臨的最大挑戰是其「幻覺」問題與信任赤字。傳統的檢索增強生成（RAG）雖有助益，卻難以提供可驗證的資訊來源。然而，一個日本開發者的專案，透過「機器可讀可引用協定」（MCP）伺服器對接官方法律與稅務資料庫，展示了從簡單工具串接到建構真正可信賴 AI 系統的潛力。這項實踐證明，標準化的外部資料接口是將 LLM 轉化為在關鍵決策中值得信賴的專業工具的關鍵，確保資訊來源的可追溯與可驗證性。

RAG 的侷限與專業領域的信任赤字

自從大型語言模型展現出強大的自然語言處理能力以來，檢索增強生成（Retrieval-Augmented Generation, RAG）便成為將其應用於特定知識領域的主流架構。其核心思想是，在生成答案前，先從外部知識庫中檢索相關資訊，再交由模型進行綜合與回答。這個方法在許多場景下表現優異，但當應用場景轉移到法律、稅務或臨床醫學等不容許錯誤的領域時，傳統 RAG 的限制便暴露無遺。

多數 RAG 系統的知識來源是靜態的 PDF 文件、非結構化的網頁內容或內部文件。系統將這些資料切分成無數個「文本塊」（chunks），在需要時進行向量檢索。這種方法的根本問題在於，它破壞了資訊的原始脈絡與權威性。檢索到的只是一個文本片段，而非一份可追溯、可引用的官方文件。

當模型依據這些碎片化資訊生成結論時，我們很難驗證其準確性，也無法確定它是否遺漏了關鍵的上下文。這正是LLM 幻覺問題在專業領域中最致命的表現形式：它看起來極具說服力，卻可能基於一個過時的法條或被誤解的判例。

MCP 是什麼？它如何解決 RAG 的根本限制？

為了解決這個信任赤字，一種更嚴謹的系統設計思維應運而生，其核心是建立標準化的外部資料接口。近期由日本開發者 Shuji Bonji 實作的一系列 MCP 伺服器便是一個具體的縮影。MCP（Machine-readable Citable Protocol，機器可讀可引用協定）並非一個官方標準，而是一種設計模式，旨在讓 AI 系統能以結構化、可驗證的方式存取權威資料源。

這個專案的目標非常明確：讓 LLM 在回答日本法律問題時，能準確引用來自官方的第一手資訊，徹底消除幻覺。開發者並非去爬取大量法律網站，而是直接對接了日本政府的官方資料 API，例如 e-Gov 法令 API v2 以及國稅廳（NTA）的公開資料。透過 MCP 伺服器作為中介，LLM 的「檢索」行為從模糊的文本匹配，轉變為精準的 API 呼叫。

我們可以透過一個簡單的比較，看出這種模式的優越性：

特性	傳統 RAG	基於 MCP 的可信系統
資料來源	非結構化文件（PDF, HTML）	權威、結構化的 API
檢索單位	文本塊（Chunk）	具體的文件、法條、條款
可驗證性	低，難以追溯原始上下文	高，可直接引用來源連結與版本
即時性	依賴定期重新索引，有延遲	接近即時，直接查詢最新資料

為什麼從「工具串接」走向「可信系統」如此重要？

目前許多 AI 應用的開發，仍停留在「工具串接」（tool-chaining）的思維。我們使用 LangChain 或 LlamaIndex 等框架，像組裝樂高一樣將模型、向量資料庫和各種 API 串接起來，快速打造出原型。這在探索階段非常有效，但若要建構一個能承擔專業責任的系統，這種鬆散的耦合是遠遠不夠的。

一個真正的專業 AI 系統，其價值不僅在於「知道什麼」，更在於「知道自己是如何知道的」。後者正是可驗證性與可信賴性的基石。

從工具串接邁向可信系統，意味著一種思維上的轉變。我們不再將外部資料視為一個被動的「知識庫」，而是將其視為一個動態、權威的「事實來源」。系統的設計重點，從如何更聰明地「猜測」答案，轉變為如何更可靠地「驗證」答案。

這要求我們在系統架構中，優先考慮與權威資料源的穩定對接，並建立嚴謹的引用與追溯機制。這也符合 NIST AI 風險管理框架等行業標準所倡導的，建構安全、可靠且值得信賴的 AI 系統的原則。

日本開發者的 MCP 專案，雖然規模不大，卻精準地指向了未來專業 AI 系統的發展方向。它提醒我們，在追求更強大模型的同時，或許更應該回頭審視系統的基礎：資料的源頭。當 LLM 的每一次回答，都能附上一個指向官方資料庫的、不可否認的連結時，我們才算真正跨出了將 AI 應用於高風險領域的第一步。這不僅是技術的演進，更是責任的體現。

延伸閱讀

我是江中喬，專注於 AI Agent Architecture、Memory Governance 與 Cognitive Diversity，持續研究如何打造能夠長期協作、可信任且可治理的 AI 系統。

RAG 的侷限與專業領域的信任赤字

MCP 是什麼？它如何解決 RAG 的根本限制？

為什麼從「工具串接」走向「可信系統」如此重要？

延伸閱讀

Sign up for more like this.