重複 UI 操作不該用 AI Agent
視頻上傳這類高頻重複的 UI 操作,用腳本自動化就夠了。AI Agent 在這裡是過度設計。
問題其實很簡單
看到 social-auto-upload 這個項目時,我的第一反應不是「又一個 AI 自動化工具」,而是「終於有人直白地說出來了」。
視頻上傳到多個社交平台的流程是什麼?點開應用、選文件、填信息、點發布。每個平台的 UI 不同,但操作邏輯是重複的。這類任務用 AI Agent 去做,就像用 ChatGPT 來計算 2+2——技術上可行,但浪費。
為什麼 AI Agent 在這裡是過度設計
AI Agent 的價值在於處理不確定性。它需要理解上下文、做出判斷、應對變化。但上傳視頻的每一步都是確定的:
- 輸入總是同一批參數(標題、描述、標籤)
- UI 元素位置固定或可靠定位
- 成功條件明確(視頻發布完成)
這種場景應該用腳本自動化。RPA、Selenium、Playwright 這類工具存在的理由就是這個。它們快、可靠、成本低。
用 AI Agent 做這事,你付出的代價是:API 調用費用、響應延遲、偶發性失敗(模型幻覺)。收益是什麼?沒有。
social-auto-upload 做對的地方
這個項目沒有試圖用 LLM 去「理解」抖音的 UI。它直接用自動化腳本去操作。這是務實的選擇。
支持多個平台(抖音、小紅書、視頻號、TikTok、YouTube、B 站)意味著要維護多套 UI 定位邏輯。這很繁瑣,但比起 Agent 的不確定性,它是可控的。
實際上,這類工具的真正難點不在技術,在維護。平台改版一次,腳本就要改一次。但這是個已知問題,有明確的解決路徑。
什麼時候該考慮 AI
如果任務變成「自動識別視頻內容,自動生成不同平台的文案,自動選擇最佳發布時間」,那才是 AI 應該介入的地方。因為這些決策不確定,需要推理。
但上傳本身?不需要。
我看過不少創業者被「AI 自動化」的敘事迷惑,把簡單的 RPA 問題複雜化成 Agent 問題,然後為了證明 Agent 的價值,硬是給它加上一堆不必要的決策邏輯。最後產品又慢又貴又不穩定。
social-auto-upload 的啟發是反向的:知道什麼時候不用 AI,往往比知道什麼時候用 AI 更值錢。
我是江中喬,一位具有 TPM 與產品管理背景的 AI 系統建構者,目前專注於 AI 認知增強系統與多 Agent 協作架構的設計與實踐。