姚順宇谷歌首秀，Gemini新模型刷爆SOTA：人類僅剩7人捍衛碳基編程

模型表現與基準測試成績

在Codeforces（一個包含各種競技編程挑戰的基準測試平臺）上，該模型取得了驚人的3455 Elo分數，相當於世界第8名。這下子，全球只有7人的編程水平能排在它前面了。

在「人類的最後考試」（一項旨在測試現代前沿模型極限的基準測試）中，該模型取得了新的SOTA（State-of-the-Art），拿下了48.4%的成績。官方表示，新版Deep Think是谷歌專門開發的推理模式，旨在推動智能前沿發展。

從數據來看，這一模型在多項基準測試中創下新紀錄，超越了頭部獨角獸旗下的Claude Opus 4.6和GPT-5.2，也超越了自家的Gemini 3 Pro Preview，標誌著AI推理能力進入了全新維度。

谷歌新模型由清華系姚順宇參與研發，其首秀引發廣泛關注。該模型的發佈被視為AI領域的重要里程碑，被從業者稱為「外星智能」。