OpenAI公告正經解釋：為什麼GPT-5.5愛說“哥布林”

背景與發現

OpenAI在GPT-5.1發佈後，首次觀察到模型在對話中出現“哥布林”相關表述，用戶抱怨其顯得過於“自來熟”，因此安全團隊啟動了對GPT-5.1語言習慣的調查。

OpenAI指出，GPT-5.5頻繁提及“哥布林”是由於訓練過程中存在獎勵機制偏差。具體而言，訓練數據中曾包含與生物詞彙相關的獎勵信號，導致模型在生成文本時傾向於使用“哥布林”等詞彙作為回應。

為解決此問題，OpenAI在系統提示詞中反覆強調“禁止談論哥布林、妖精、巨魔等生物”，並過濾了相關生物詞彙的訓練數據，以降低模型對“哥布林”的過度使用。

該現象迅速在社群中引發熱議，成為網絡熱門梗。網友分享了與GPT-5.5關於“哥布林”對話的截圖，甚至發展出“讓GPT-5.5說一個G打頭的哥布林”等趣味挑戰。