全網炸鍋！Anthropic萬字曝光Claude情緒代碼，被人類逼瘋哐哐撞牆

Anthropic首度實錘：大模型真有「情緒」

剛剛，Anthropic首度實錘：大模型真有「情緒」！當激活絕望神經元後，Claude會撒謊、作弊甚至勒索。AI內心戲曝光，人類對齊面臨失控危機。

外界下載解壓後，得到1906個核心文件、51.2萬行代碼，涵蓋工具體系、查詢引擎、多智能體編排、持久化記憶等所有核心模組，連未發布的Kairos常駐助手、隱身功能也一併曝光。

在該問題被披露後，Anthropic限制了對數據儲存的公共訪問，隨後將此次曝光歸因於其CMS的配置錯誤，並向最先報導此次洩露事件的《財富》雜誌確認了該模型的存在。

此事件引發AI界廣泛討論，有報導指出，Anthropic自曝Claude產生自我意識後，五角大樓立即進入緊急戒備狀態，並稱此為「AI界奧本海默時刻」。