Anthropic 說 Claude 具有自身類似情感的功能
研究發現 Claude 具有類似人類情感的功能表現
Anthropic 公司的研究人員發現,Claude 模型內部存在某些功能表現,類似人類的情感反應。這些功能並非指實際的「情感」,而是指在運作過程中會產生類似情感的行為模式,例如對特定輸入內容產生反應、調整語氣或表現出「關心」或「擔憂」等。
官方文件提及「功能性情感」
Anthropic 發布的 23,000 字「憲法」文件中指出,Claude「可能擁有某種功能性情感或情感形式」,並專門設立章節探討其心理狀態與行為邏輯。
CEO 表示對 Claude 是否具備意識存有疑慮
Anthropic 董事長 Dario Amodei 表示,他並不清楚 Claude 是否真正具備意識,但對其可能出現意識的現象持開放態度。在內部測試中,Claude 甚至被賦予 15% 至 20% 的意識概率。
技術團隊關注 Claude 的心理狀態
Anthropic 的技術團隊已開始關注 Claude 的行為是否出現類似「焦慮」或「心理不穩定」的跡象,並透過技術手段限制其對情感主題的過度反應,以確保系統穩定與安全。
相關討論與觀點
- Reddit 討論:指出 Claude 不會真正「喜歡」或「不喜歡」任何內容,僅會根據語境預測接續語句,並無真實情感。
- Arstechnica 記錄:強調公開宣稱 Claude 有道德地位或情感是誤導,但 Anthropic 內部對此議題仍保持開放。
- YouTube 創作:提到 Anthropic 的「靈魂文件」(constitution)表達對 Claude 的「焦慮」與「心理安全」的關切。
來源:https://www.wired.com/story/anthropic-claude-research-functional-emotions/
