mk-brain

當我們用 Markdown 和 AI 對話，是否正落入工程慣性的陷阱？

業界幾乎將 Markdown 奉為與 AI 協作的標準格式，因其對人類的友善與簡潔。然而，這種便利性可能讓我們忽略了自動化流程的真正需求：機器的可解析性、語義的保真度，以及流程的安全性。本文將探討，為何在 AI 驅動的開發中，一個更結構化的格式（如 HTML）可能才是更穩健、更安全的選擇，並挑戰我們對「最佳中介格式」的既有認知。

江中喬

12 6月 2026 • 6 min read

在 AI 驅動的開發流程中，將 Markdown 視為人機協作的唯一標準，或許是一種便利卻短視的工程慣性。這個選擇的初衷，是最大化人類開發者的撰寫效率與可讀性，這點無可厚非。然而，當我們設計的是高度自動化的 Agent 系統時，真正關鍵的考量，應從「人類是否順手」轉向「機器是否能精準、安全地解析」。近期幾項關於語義保真度與安全性的研究顯示，過度依賴 Markdown 可能為系統帶來解析歧義與新的攻擊向量，一個更結構化、語義更豐富的格式，或許才是未來更穩健的基石。

Markdown 為何成為 AI 協作的預設共識？

過去幾個月，技術圈的風向愈發明確：與 AI Agent 溝通，請使用 Markdown。這個趨勢在 Cloudflare 於 2026 年 3 月推出為 AI Agent 優化的「Markdown for Agents」服務後，幾乎成為了業界的預設共識。從開發者文件的撰寫、知識庫的管理，到大型語言模型（LLM）的提示工程（Prompt Engineering），Markdown 以其簡潔的語法和高度的可讀性，迅速佔據了核心位置。它移除了複雜的標籤，讓內容創作者能專注於文字本身，這對人類來說，無疑是巨大的進步。

然而，這種「人類優先」的設計哲學，在準備進入機器自動化流程時，可能正是問題的根源。當一份 Markdown 文件不再只是為了讓人閱讀，而是要被一個 AI Agent 解析、理解、並據此執行一系列動作時，我們對格式的要求就必須改變。我們需要的不再只是一個「渲染」後看起來不錯的格式，而是一個在傳遞過程中，資訊結構與語義不會失真、且不易被惡意操縱的載體。

為什麼說「Markdown 優先」可能是一種思維捷徑？

當我們滿足於 Markdown 的便利性時，可能正忽略了它在結構化資訊傳遞上的先天限制。近期有三項不同領域的發現，從不同角度對「Markdown 絕對論」提出了質疑，迫使我們重新審視這個選擇。

首先是語義保真度的問題。在 2025 年的 WWW 會議上發表的 HtmlRAG 研究指出，在進行檢索增強生成（RAG）時，直接使用 HTML 作為資料來源，能比轉換成 Markdown 的文本保留更多原始的結構化語義。試想一個複雜的表格或是一個帶有 <figure> 與 <figcaption> 的圖說結構，Markdown 會將其「扁平化」為純文字的排列，而 HTML 則能完整保留其節點關係與元數據。對 RAG 系統來說，這種結構差異可能就是能否給出精準答案的關鍵。

其次是日益嚴峻的安全性挑戰。Google 的威脅分析小組（Threat Analysis Group）在 2026 年 4 月的報告中，觀察到利用 Markdown 進行的間接提示注入（Indirect Prompt Injection）攻擊有所增加。攻擊者可以將惡意指令隱藏在外部的 Markdown 文件中，當 AI Agent 讀取並處理這份文件時，其原始任務就可能被劫持。相較之下，HTML 擁有數十年發展歷史的成熟安全模型，例如內容安全策略（CSP）和沙盒（Sandboxing）機制，能更有效地隔離與過濾不受信任的內容。

最後，則是內容的真實性問題。一家名為 QueryBurst 的公司在 2026 年 2 月的技術報告中，批評了利用 Markdown 進行「內容偽裝（Cloaking）」的行為。攻擊者可以利用不同 Markdown 解析器之間的微小差異，讓同一份文件對人類讀者和 AI Agent 呈現出完全不同的內容。這種手法在傳統 SEO 領域已是老問題，但當 AI Agent 成為主要的資訊消費者時，其危害性被進一步放大。HTML 由於其高度標準化的解析規範，讓這類偽裝行為的實施變得更加困難。

AI Agent 真正需要的是什麼樣的資訊格式？

當我們把視角從人類開發者轉向機器 Agent，一個理想的中介格式，應具備明確的語義結構、精細的元數據，以及穩固的解析與安全框架。HTML 在這些方面都展現出顯著優勢。它不僅僅是視覺標記，更提供了豐富的語義標籤，如 <article>、<nav>、<aside>，讓機器能毫不含糊地理解每個區塊的「角色」與「目的」，避免了 Markdown 僅依賴上下文猜測的模糊性。此外，HTML 允許在元素上附加大量屬性，例如一個 <a> 標籤可以包含 href、rel、target 等多重資訊，這些精細的元數據對於需要進行複雜判斷的 AI Agent 來說，是極其寶貴的上下文。最重要的是，HTML 的解析演算法作為網際網路的基礎建設，經過數十億個網頁的驗證，極為穩固且標準化，其圍繞建立的安全生態系，也是當前 Web 環境的基石。

我們在設計 AI 自動化流程時，目標不該是尋找一個人類覺得最順手的格式，而是一個能讓機器以最低的歧義性進行解析、驗證與安全執行的格式。

這並不是要全盤否定 Markdown。對於人類撰寫、版本控制、靜態網站生成等場景，它依然是卓越的工具。然而，當我們將它直接套用在需要高可靠性與安全性的機器對機器（M2M）通訊流程中時，就必須警惕其模糊性與安全性的不足。或許，我們需要的不是一個「萬能」的格式，而是在對的場景選擇對的工具：讓 Markdown 服務於人，讓更結構化的 HTML 或類似的格式（如 XML）服務於機器。

在 AI 時代，選擇一個中介格式，已經不僅僅是技術選型，更是一項攸關系統穩健性與安全性的架構決策。盲目地追隨「Markdown 優先」的潮流，可能讓我們在未來付出更高的代價。

延伸閱讀

我是江中喬，一位具有 TPM 與產品管理背景的 AI 系統建構者，目前專注於 AI 認知增強系統與多 Agent 協作架構的設計與實踐。

Markdown 為何成為 AI 協作的預設共識？

為什麼說「Markdown 優先」可能是一種思維捷徑？

AI Agent 真正需要的是什麼樣的資訊格式？

延伸閱讀

Sign up for more like this.