姚順宇谷歌首秀,Gemini新模型刷爆SOTA:人類僅剩7人捍衛碳基編程

姚順宇谷歌首秀,Gemini新模型刷爆SOTA:人類僅剩7人捍衛碳基編程

模型表現與基準測試成績

在Codeforces(一個包含各種競技編程挑戰的基準測試平臺)上,該模型取得了驚人的3455 Elo分數,相當於世界第8名。這下子,全球只有7人的編程水平能排在它前面了。

推理能力突破與SOTA刷新

在「人類的最後考試」(一項旨在測試現代前沿模型極限的基準測試)中,該模型取得了新的SOTA(State-of-the-Art),拿下了48.4%的成績。官方表示,新版Deep Think是谷歌專門開發的推理模式,旨在推動智能前沿發展。

技術升級與行業影響

從數據來看,這一模型在多項基準測試中創下新紀錄,超越了頭部獨角獸旗下的Claude Opus 4.6和GPT-5.2,也超越了自家的Gemini 3 Pro Preview,標誌著AI推理能力進入了全新維度。

研發背景與團隊參與

谷歌新模型由清華系姚順宇參與研發,其首秀引發廣泛關注。該模型的發佈被視為AI領域的重要里程碑,被從業者稱為「外星智能」。

來源:https://36kr.com/p/3681358416129668

返回頂端