重複 UI 操作不該用 AI Agent

視頻上傳這類高頻重複的 UI 操作，用腳本自動化就夠了。AI Agent 在這裡是過度設計。

11 4月 2026 • 3 min read

問題其實很簡單

看到 social-auto-upload 這個項目時，我的第一反應不是「又一個 AI 自動化工具」，而是「終於有人直白地說出來了」。

視頻上傳到多個社交平台的流程是什麼？點開應用、選文件、填信息、點發布。每個平台的 UI 不同，但操作邏輯是重複的。這類任務用 AI Agent 去做，就像用 ChatGPT 來計算 2+2——技術上可行，但浪費。

AI Agent 的價值在於處理不確定性。它需要理解上下文、做出判斷、應對變化。但上傳視頻的每一步都是確定的：

這種場景應該用腳本自動化。RPA、Selenium、Playwright 這類工具存在的理由就是這個。它們快、可靠、成本低。

用 AI Agent 做這事，你付出的代價是：API 調用費用、響應延遲、偶發性失敗（模型幻覺）。收益是什麼？沒有。

這個項目沒有試圖用 LLM 去「理解」抖音的 UI。它直接用自動化腳本去操作。這是務實的選擇。

支持多個平台（抖音、小紅書、視頻號、TikTok、YouTube、B 站）意味著要維護多套 UI 定位邏輯。這很繁瑣，但比起 Agent 的不確定性，它是可控的。

實際上，這類工具的真正難點不在技術，在維護。平台改版一次，腳本就要改一次。但這是個已知問題，有明確的解決路徑。

如果任務變成「自動識別視頻內容，自動生成不同平台的文案，自動選擇最佳發布時間」，那才是 AI 應該介入的地方。因為這些決策不確定，需要推理。

但上傳本身？不需要。

我看過不少創業者被「AI 自動化」的敘事迷惑，把簡單的 RPA 問題複雜化成 Agent 問題，然後為了證明 Agent 的價值，硬是給它加上一堆不必要的決策邏輯。最後產品又慢又貴又不穩定。

social-auto-upload 的啟發是反向的：知道什麼時候不用 AI，往往比知道什麼時候用 AI 更值錢。

我是江中喬，一位具有 TPM 與產品管理背景的 AI 系統建構者，目前專注於 AI 認知增強系統與多 Agent 協作架構的設計與實踐。