OpenAI聲稱ChatGPT最新預設模型大幅減少幻覺現象

OpenAI聲稱ChatGPT最新預設模型大幅減少幻覺現象

OpenAI宣稱新GPT-5.5 Instant模型大幅降低幻覺

OpenAI表示,其最新預設模型GPT-5.5 Instant在事實正確性方面有顯著進步,根據內部評估,該模型產生的幻覺陳述比先前版本少了52.5%。

幻覺問題仍存在,但持續改善

儘管OpenAI聲稱GPT-5.5 Instant大幅減少幻覺,但相關研究與報告指出,語言模型的幻覺問題仍普遍存在,僅是程度有所緩和。例如,先前版本的GPT-5已顯示減少幻覺,但幻覺仍會在特定情境下出現。

相關技術與評估方法

  • OpenAI指出,幻覺問題部分源自於標準訓練與評估方式,並提出改進方案以降低其發生機率。
  • 在模型測試中,GPT-5.3 Instant相較於前代模型,幻覺減少達26.8%。
  • 然而,部分測試顯示,新版本模型如o3的幻覺率仍達33%,顯示問題尚未完全解決。

來源與進一步資訊

更多細節可參考OpenAI官方網站與相關研究論文。

OpenAI – 關於語言模型幻覺的說明

OpenAI研究論文:語言模型如何產生幻覺

來源:https://www.theverge.com/ai-artificial-intelligence/924225/openai-chatgpt-default-model-gpt-5-5-instant

返回頂端