OpenAI聲稱ChatGPT最新預設模型大幅減少幻覺現象
OpenAI宣稱新GPT-5.5 Instant模型大幅降低幻覺
OpenAI表示,其最新預設模型GPT-5.5 Instant在事實正確性方面有顯著進步,根據內部評估,該模型產生的幻覺陳述比先前版本少了52.5%。
幻覺問題仍存在,但持續改善
儘管OpenAI聲稱GPT-5.5 Instant大幅減少幻覺,但相關研究與報告指出,語言模型的幻覺問題仍普遍存在,僅是程度有所緩和。例如,先前版本的GPT-5已顯示減少幻覺,但幻覺仍會在特定情境下出現。
相關技術與評估方法
- OpenAI指出,幻覺問題部分源自於標準訓練與評估方式,並提出改進方案以降低其發生機率。
- 在模型測試中,GPT-5.3 Instant相較於前代模型,幻覺減少達26.8%。
- 然而,部分測試顯示,新版本模型如o3的幻覺率仍達33%,顯示問題尚未完全解決。
來源與進一步資訊
更多細節可參考OpenAI官方網站與相關研究論文。
