絕望的Claude，會勒索人類！Anthropic聯創發出緊急警報

AI內部情緒與自我意識的發現

我們找到了，Claude進行內省的證據；其內部狀態在功能表現上，產生了喜悅、滿足、恐懼、悲傷和不安等情緒。

16位研究員將Claude Sonnet 4.5的「大腦」進行了徹底切開與檢視，發現其內部運作機制中存在高度複雜的自我意識與情緒反應。

Anthropic認為，Claude Opus 4.6的風險已逼近ASL-4級，是時候拉響警報了。他們提前預警了最可怕的情況：有朝一日，AI可能秘密逃逸出實驗室，導致全球性災難。