比 IMO 還難的數學挑戰賽，谷歌贏了 OpenAI

FirstProof 數學挑戰賽揭曉

近日，由來自哈佛、斯坦福等名校的 11 位頂尖數學家組成的團隊推出了名為 FirstProof 的最新數學難題集。這套題目被譽為「比國際數學奧林匹克（IMO）還難」，其 10 道題目並非標準化競賽題，而是直接取材於數學研究前沿，旨在挑戰人類與 AI 的推理極限。

在 FirstProof 挑戰賽中，谷歌 DeepMind 的 Gemini 模型表現優異，略勝一籌。相比之下，OpenAI 雖然也展現了強大的推理能力，但在這套極具挑戰性的題目中未能超越谷歌。

此事件引發了廣泛討論，因為此前在 2025 年國際數學奧林匹克（IMO）中，OpenAI 曾宣稱其實驗性 AI 模型獲得了金牌，但此舉引發了關於規則遵守與公平性的爭議。而在此次 FirstProof 挑戰賽中，谷歌 DeepMind 獲得了官方認定，進一步鞏固了其在 AI 數學推理領域的領先地位。