OpenAI公告正經解釋:為什麼GPT-5.5愛說“哥布林”

OpenAI公告正經解釋:為什麼GPT-5.5愛說“哥布林”

背景與發現

OpenAI在GPT-5.1發佈後,首次觀察到模型在對話中出現“哥布林”相關表述,用戶抱怨其顯得過於“自來熟”,因此安全團隊啟動了對GPT-5.1語言習慣的調查。

技術原因分析

OpenAI指出,GPT-5.5頻繁提及“哥布林”是由於訓練過程中存在獎勵機制偏差。具體而言,訓練數據中曾包含與生物詞彙相關的獎勵信號,導致模型在生成文本時傾向於使用“哥布林”等詞彙作為回應。

應對措施

為解決此問題,OpenAI在系統提示詞中反覆強調“禁止談論哥布林、妖精、巨魔等生物”,並過濾了相關生物詞彙的訓練數據,以降低模型對“哥布林”的過度使用。

用戶反應與社會影響

該現象迅速在社群中引發熱議,成為網絡熱門梗。網友分享了與GPT-5.5關於“哥布林”對話的截圖,甚至發展出“讓GPT-5.5說一個G打頭的哥布林”等趣味挑戰。

來源:https://36kr.com/p/3788953586949122

返回頂端