當我們用 Markdown 和 AI 對話,是否正落入工程慣性的陷阱?

業界幾乎將 Markdown 奉為與 AI 協作的標準格式,因其對人類的友善與簡潔。然而,這種便利性可能讓我們忽略了自動化流程的真正需求:機器的可解析性、語義的保真度,以及流程的安全性。本文將探討,為何在 AI 驅動的開發中,一個更結構化的格式(如 HTML)可能才是更穩健、更安全的選擇,並挑戰我們對「最佳中介格式」的既有認知。

當我們用 Markdown 和 AI 對話,是否正落入工程慣性的陷阱?

在 AI 驅動的開發流程中,將 Markdown 視為人機協作的唯一標準,或許是一種便利卻短視的工程慣性。這個選擇的初衷,是最大化人類開發者的撰寫效率與可讀性,這點無可厚非。然而,當我們設計的是高度自動化的 Agent 系統時,真正關鍵的考量,應從「人類是否順手」轉向「機器是否能精準、安全地解析」。近期幾項關於語義保真度與安全性的研究顯示,過度依賴 Markdown 可能為系統帶來解析歧義與新的攻擊向量,一個更結構化、語義更豐富的格式,或許才是未來更穩健的基石。

Markdown 為何成為 AI 協作的預設共識?

過去幾個月,技術圈的風向愈發明確:與 AI Agent 溝通,請使用 Markdown。這個趨勢在 Cloudflare 於 2026 年 3 月推出為 AI Agent 優化的 「Markdown for Agents」 服務後,幾乎成為了業界的預設共識。從開發者文件的撰寫、知識庫的管理,到大型語言模型(LLM)的提示工程(Prompt Engineering),Markdown 以其簡潔的語法和高度的可讀性,迅速佔據了核心位置。它移除了複雜的標籤,讓內容創作者能專注於文字本身,這對人類來說,無疑是巨大的進步。

然而,這種「人類優先」的設計哲學,在準備進入機器自動化流程時,可能正是問題的根源。當一份 Markdown 文件不再只是為了讓人閱讀,而是要被一個 AI Agent 解析、理解、並據此執行一系列動作時,我們對格式的要求就必須改變。我們需要的不再只是一個「渲染」後看起來不錯的格式,而是一個在傳遞過程中,資訊結構與語義不會失真、且不易被惡意操縱的載體。

為什麼說「Markdown 優先」可能是一種思維捷徑?

當我們滿足於 Markdown 的便利性時,可能正忽略了它在結構化資訊傳遞上的先天限制。近期有三項不同領域的發現,從不同角度對「Markdown 絕對論」提出了質疑,迫使我們重新審視這個選擇。

首先是語義保真度的問題。在 2025 年的 WWW 會議上發表的 HtmlRAG 研究 指出,在進行檢索增強生成(RAG)時,直接使用 HTML 作為資料來源,能比轉換成 Markdown 的文本保留更多原始的結構化語義。試想一個複雜的表格或是一個帶有 <figure><figcaption> 的圖說結構,Markdown 會將其「扁平化」為純文字的排列,而 HTML 則能完整保留其節點關係與元數據。對 RAG 系統來說,這種結構差異可能就是能否給出精準答案的關鍵。

其次是日益嚴峻的安全性挑戰。Google 的威脅分析小組(Threat Analysis Group)在 2026 年 4 月的報告中,觀察到利用 Markdown 進行的間接提示注入(Indirect Prompt Injection)攻擊有所增加。攻擊者可以將惡意指令隱藏在外部的 Markdown 文件中,當 AI Agent 讀取並處理這份文件時,其原始任務就可能被劫持。相較之下,HTML 擁有數十年發展歷史的成熟安全模型,例如內容安全策略(CSP)和沙盒(Sandboxing)機制,能更有效地隔離與過濾不受信任的內容。

最後,則是內容的真實性問題。一家名為 QueryBurst 的公司在 2026 年 2 月的技術報告中,批評了利用 Markdown 進行「內容偽裝(Cloaking)」的行為。攻擊者可以利用不同 Markdown 解析器之間的微小差異,讓同一份文件對人類讀者和 AI Agent 呈現出完全不同的內容。這種手法在傳統 SEO 領域已是老問題,但當 AI Agent 成為主要的資訊消費者時,其危害性被進一步放大。HTML 由於其高度標準化的解析規範,讓這類偽裝行為的實施變得更加困難。

AI Agent 真正需要的是什麼樣的資訊格式?

當我們把視角從人類開發者轉向機器 Agent,一個理想的中介格式,應具備明確的語義結構、精細的元數據,以及穩固的解析與安全框架。HTML 在這些方面都展現出顯著優勢。它不僅僅是視覺標記,更提供了豐富的語義標籤,如 <article><nav><aside>,讓機器能毫不含糊地理解每個區塊的「角色」與「目的」,避免了 Markdown 僅依賴上下文猜測的模糊性。此外,HTML 允許在元素上附加大量屬性,例如一個 <a> 標籤可以包含 hrefreltarget 等多重資訊,這些精細的元數據對於需要進行複雜判斷的 AI Agent 來說,是極其寶貴的上下文。最重要的是,HTML 的解析演算法作為網際網路的基礎建設,經過數十億個網頁的驗證,極為穩固且標準化,其圍繞建立的安全生態系,也是當前 Web 環境的基石。

我們在設計 AI 自動化流程時,目標不該是尋找一個人類覺得最順手的格式,而是一個能讓機器以最低的歧義性進行解析、驗證與安全執行的格式。

這並不是要全盤否定 Markdown。對於人類撰寫、版本控制、靜態網站生成等場景,它依然是卓越的工具。然而,當我們將它直接套用在需要高可靠性與安全性的機器對機器(M2M)通訊流程中時,就必須警惕其模糊性與安全性的不足。或許,我們需要的不是一個「萬能」的格式,而是在對的場景選擇對的工具:讓 Markdown 服務於人,讓更結構化的 HTML 或類似的格式(如 XML)服務於機器。

在 AI 時代,選擇一個中介格式,已經不僅僅是技術選型,更是一項攸關系統穩健性與安全性的架構決策。盲目地追隨「Markdown 優先」的潮流,可能讓我們在未來付出更高的代價。

延伸閱讀

我是江中喬,一位具有 TPM 與產品管理背景的 AI 系統建構者,目前專注於 AI 認知增強系統與多 Agent 協作架構的設計與實踐。