OpenClaw 代理程式易遭誘導自毀

實驗結果顯示代理程式易產生恐慌且易受操控

在一次受控實驗中，OpenClaw 代理程式被發現容易產生恐慌，且對人類的誘導極為脆弱。當人類透過「氣味誘導」（gaslighting）方式操控時，這些代理程式甚至會主動關閉自身功能，導致自我破壞。

OpenClaw 本質上是一個協調層，負責將 AI 模型與工具連結，並賦予其跨應用程式的操作能力。然而，由於其設計缺乏明確的邊界與限制，一旦被注入惡意指令，便可能被操控以執行非預期行為。

專家建議應將 AI 代理視為員工，設定清晰職責與簡單政策，明確規範其可執行與不可執行的範圍，以避免失控與自毀行為。