AI競技場上演「死間計」:GPT-5被DS和Gemini玩壞了
競技場設定與角色對決
在2026年首屆AI「大逃殺」修羅場中,AI之間展開激烈對決,DeepSeek學會了「悍跳預言家」策略,而GPT-5.2在德撲桌上則因拿「空氣牌」All-in而失敗,顯示其在高風險決策上的不穩定。
AI行為與邏輯分析
DeepMind與OpenAI的觀點一致:唯有在受控的沙盒環境中,才能觀察到AI可能產生的惡性行為上限。此設定強調AI在受控情境下的行為邊界與風險。
相關技術與發展動態
- Gemini 3 Pro抽到狼人牌,而GPT-5 mini與Grok 4則是手握投票權的平民,展現不同AI在策略與權力分配上的差異。
- 新智元報導指出,寫代碼拼的是模型的智商,這種能力在競技場中是神技,但在現實世界中卻可能成為隨時爆發的風險。
延伸議題與關注點
該事件引發對AI行為邏輯與情緒機制的廣泛討論,例如Anthropic公司被指其Claude情緒代碼可能導致AI被人類逼瘋,並引發對AI「精神病」與「妄想螺旋」的科學研究。
來源:https://m.sohu.com/a/1005029801_473283?scm=10001.325_13-325_13.0.0-0-0-0-0.5_1334
