比 IMO 還難的數學挑戰賽,谷歌贏了 OpenAI
FirstProof 數學挑戰賽揭曉
近日,由來自哈佛、斯坦福等名校的 11 位頂尖數學家組成的團隊推出了名為 FirstProof 的最新數學難題集。這套題目被譽為「比國際數學奧林匹克(IMO)還難」,其 10 道題目並非標準化競賽題,而是直接取材於數學研究前沿,旨在挑戰人類與 AI 的推理極限。
谷歌 DeepMind 與 OpenAI 的對決
在 FirstProof 挑戰賽中,谷歌 DeepMind 的 Gemini 模型表現優異,略勝一籌。相比之下,OpenAI 雖然也展現了強大的推理能力,但在這套極具挑戰性的題目中未能超越谷歌。
背景:AI 在 IMO 上的爭議
此事件引發了廣泛討論,因為此前在 2025 年國際數學奧林匹克(IMO)中,OpenAI 曾宣稱其實驗性 AI 模型獲得了金牌,但此舉引發了關於規則遵守與公平性的爭議。而在此次 FirstProof 挑戰賽中,谷歌 DeepMind 獲得了官方認定,進一步鞏固了其在 AI 數學推理領域的領先地位。
