姚順宇谷歌首秀,Gemini新模型刷爆SOTA:人類僅剩7人捍衛碳基編程

姚順宇谷歌首秀,Gemini新模型刷爆SOTA:人類僅剩7人捍衛碳基編程

模型表現與基準測試成績

在Codeforces競技編程平臺,新發布的Gemini Deep Think模型取得了3455 Elo分數,相當於全球編程能力排名前八,僅有7人能超越其水平。

關鍵測試與技術突破

在「人類的最後考試」(HLE)這一旨在測試前沿AI模型極限的基準測試中,Gemini 3 Deep Think模型取得了48.4%的成績,刷新了SOTA(State-of-the-Art)紀錄。

研發背景與團隊成員

姚順宇現任谷歌DeepMind高級研究員,曾任職於Anthropic的Claude團隊,是清華物理系傳奇特獎得主,被譽為“學神”。此次Deep Think模式的升級,是其深度參與下推出的推理模型。

技術對比與行業影響

該模型在多項基準測試中創下新紀錄,超越了頭部獨角獸旗下的Claude Opus 4.6和GPT-5.2,也超越了自家的Gemini 3 Pro Preview,標誌著谷歌在AI推理領域取得重大突破。

來源:https://36kr.com/p/3681358416129668

返回頂端