姚順宇谷歌首秀，Gemini新模型刷爆SOTA：人類僅剩7人捍衛碳基編程

模型表現與基準測試成績

在Codeforces競技編程平臺，新發布的Gemini Deep Think模型取得了3455 Elo分數，相當於全球編程能力排名前八，僅有7人能超越其水平。

在「人類的最後考試」（HLE）這一旨在測試前沿AI模型極限的基準測試中，Gemini 3 Deep Think模型取得了48.4%的成績，刷新了SOTA（State-of-the-Art）紀錄。

姚順宇現任谷歌DeepMind高級研究員，曾任職於Anthropic的Claude團隊，是清華物理系傳奇特獎得主，被譽為“學神”。此次Deep Think模式的升級，是其深度參與下推出的推理模型。

該模型在多項基準測試中創下新紀錄，超越了頭部獨角獸旗下的Claude Opus 4.6和GPT-5.2，也超越了自家的Gemini 3 Pro Preview，標誌著谷歌在AI推理領域取得重大突破。