Maki Chiang｜Notes

Sign in Subscribe

LLM

一句 Prompt 就能讓 LLM 忘記安全訓練：GRP-Obliteration 的警示

一句 Prompt 就能讓 LLM 忘記安全訓練：GRP-Obliteration 的警示

Microsoft AI Red Team 發現 GRP-Obliteration 技術：只需一個 prompt 就能讓經過安全訓練的 LLM 完全撤銷安全對齊，15 個主流開源模型全部中招。

本機 LLM 不是本機：Ollama 公網曝露的風險

本機 LLM 不是本機：Ollama 公網曝露的風險

當本機 LLM 服務端點曝露到公網，風險不只算力被偷用，更可能引發資料外洩與整合鏈的連鎖問題。這篇整理我會怎麼看、以及最低限度的防護做法。

AI『潛伏特工』這件事，逼企業把治理從內容稽核升級到行為稽核

AI『潛伏特工』這件事，逼企業把治理從內容稽核升級到行為稽核

所謂 AI 潛伏特工的可怕之處，在於日常測試可能看不出異狀。企業更務實的自保方式，是把資料與行動切開、把高風險動作改成提案制，並建立可追溯性。

Prompt 不是靈感文字：把它當成可追蹤的產品資產

Prompt 不是靈感文字：把它當成可追蹤的產品資產

改了一句 prompt 就讓流程崩掉，問題通常不在註解，而在缺少 prompt 的版控、回放與回歸測試。把 prompt 當成產品資產管理，才撐得起 production。

沉睡後門與開源模型：你部署的不只是能力，也是供應鏈風險

沉睡後門與開源模型：你部署的不只是能力，也是供應鏈風險

開放權重 LLM 可能藏有『沉睡後門』：平常正常，遇到觸發詞就亂輸出。把模型當成 production dependency，供應鏈體檢與部署風險控管就成了必修。

RAG 與微調：企業導入生成式 AI 真正的成本在維運

RAG 與微調：企業導入生成式 AI 真正的成本在維運

在企業情境裡，RAG 與微調不只是技術選擇，更是兩套不同的知識治理策略；真正拉開差距的，是後續維運與稽核的設計。

Code 變便宜後，工程師的價值換了位置

Code 變便宜後，工程師的價值換了位置

當程式碼產出不再稀缺，真正拉開差距的是問題定義、架構判斷與把系統做得可維護、可更新、可驗證的能力。