mk-brain

RAG 的下一步：別再堆疊檢索器，讓模型自己決定怎麼搜

RAG 系統越堆越複雜，卻發現效率不增反降？一篇名為 A-RAG 的最新研究，為我們指出了一條新路：與其不斷疊加檢索模組，不如將決策權交還給大型語言模型（LLM），讓它像一位經驗豐富的研究員，自主判斷何時、如何、以何種粒度進行資訊檢索。這不僅是技術上的突破，更預示著 AI 系統設計思維的根本性轉變，準備好一窺 RAG 的未來了嗎？

江中喬

28 5月 2026 • 6 min read

目前的檢索增強生成（RAG）系統正走向一個複雜化的瓶頸。我們不斷堆疊查詢轉換、多路檢索、重新排序等模組，試圖窮盡所有可能來提升精度，卻也讓系統變得僵化且難以維護。然而，真正的突破或許不在於增加更多固定的流程，而是將決策權交還給模型本身。近期一篇名為 A-RAG 的研究便揭示了這個方向：讓大型語言模型（LLM）成為一個能自主決策的代理人（Agent），動態地選擇最適合的檢索策略。這代表我們將從設計「流程」轉向設計「工具箱」，是 RAG 典範的關鍵轉移。

RAG 系統為何陷入「流程」困境？

自從 2020 年 RAG 概念被提出以來，這個架構已經成為解決 LLM 知識侷限性與幻覺問題的標準方案。然而，隨著應用場景的複雜化，最初簡單的「檢索-生成」二階段流程，逐漸演變成一個由超過五個、甚至更多階段組成的複雜管線（pipeline）。我們加入了查詢擴展、多路徑檢索、精細的重排序模型（re-ranker）、再到最終的答案合成，每一個環節都試圖解決前一個環節的不足。

這種「管線思維」雖然在特定任務上取得了成功，但其根本缺陷是它的僵化性。它假設所有問題都適用同一套固定的處理流程。一個簡單的事實查核問題（例如「蘋果公司的現任 CEO 是誰？」）和一個需要深度綜合分析的開放式問題（例如「分析蘋果公司在 AI 時代的競爭優勢與挑戰」），在這種架構下卻被迫走過幾乎相同的、過度設計的路徑。這不僅浪費了大量的運算資源，也限制了模型發揮其推理能力的空間。

為什麼要把檢索決策權還給模型？

答案很直觀：因為大型語言模型本身就是一個強大的推理引擎。與其用外部的僵化規則去指導它，不如賦予它工具，讓它自己判斷該如何解決問題。這就是「代理化」（Agentic）方法的精神核心，也是 ReAct、Self-RAG 等研究框架背後的共通思想。

A-RAG 框架將這個理念推向了更實用的層次。它不做任何「預設」的檢索流程，而是直接將一組分層的檢索工具（interfaces）暴露給 LLM。模型在接收到使用者查詢後，會像一位經驗豐富的研究員般進行自我評估：它會先判斷自己是否已掌握答案無需檢索，接著思考問題所需的資訊類型——是特定實體還是廣泛概念？然後決定該使用哪種工具來獲取這些資訊，並在獲取初步資訊後，進一步判斷是否需要深挖細節。

透過這種方式，模型從一個被動的資訊「消費者」，轉變為一個主動的資訊「探尋者」。它能夠根據任務的動態需求，即時規劃並執行一條客製化的檢索路徑，從而實現了資源效率與回答精度的平衡。

我們的工作重心，將從「優化一個固定的檢索管線」轉變為「為模型提供一組強大而靈活的工具，並教會它如何自主使用」。

A-RAG 如何實現分層代理式檢索？

A-RAG 的核心創新在於它提供給模型的並非單一的檢索工具，而是一個具有不同粒度與功能的三層級工具集。這讓模型可以像人類專家一樣，先進行廣泛掃描，再逐步聚焦深入。

首先是高層級的關鍵字搜尋 (Keyword Search)。這就像我們日常使用搜尋引擎，輸入關鍵字快速定位包含特定術語、人名或專有名詞的文件。當模型判斷問題的核心是某個具體實體時，便會優先選擇此工具，以其速度優勢迅速篩選出初步資訊。

接著是中層級的語意搜尋 (Semantic Search)。它利用向量嵌入（vector embeddings）技術，超越字面匹配，尋找語意上相關的內容。當問題比較抽象、概念化，或需要理解複雜上下文時，模型會選擇語意搜尋來捕捉概念相近的資訊，進行更深層次的理解。

最後是深層級的區塊閱讀 (Chunk Reading)。當前兩層工具已經定位到一篇或數篇高度相關的文件後，如果模型認為需要更深入的細節來回答問題，就會啟用此工具。它會直接讀取特定文件的具體段落（chunks），進行精細的資訊提取與分析，確保回答的精確性與完整性。

這種分層設計讓檢索過程變得極具適應性。一個簡單問題可能只需要一次關鍵字搜尋就能解決；而一個複雜問題則可能觸發一個「語意搜尋 -> 閱讀摘要 -> 針對性關鍵字搜尋 -> 深入閱讀特定段落」的動態決策鏈。整個過程由模型自主驅動，充分利用了其內在的推理能力。

從系統建構者的角度來看，這意味著我們的挑戰不再是設計出一個完美的、一體適用的 RAG 管線。相反地，我們的目標是打造一個穩健、高效的「工具平台」，並透過提示工程（Prompt Engineering）或微調（Fine-tuning）來教會模型如何成為一個優秀的資訊研究員。這是一個更具擴展性、也更接近通用人工智慧理想的路徑。我們不再是流程的設計者，而是模型能力的賦予者。

延伸閱讀

我是江中喬，專注於 AI Agent Architecture、Memory Governance 與 Cognitive Diversity，持續研究如何打造能夠長期協作、可信任且可治理的 AI 系統。

RAG 系統為何陷入「流程」困境？

為什麼要把檢索決策權還給模型？

A-RAG 如何實現分層代理式檢索？

延伸閱讀

Sign up for more like this.