那個用半成品刷爆SOTA的Qwen3超大杯推理版,現在正式上線

那個用半成品刷爆SOTA的Qwen3超大杯推理版,現在正式上線

模型發布與性能突破

就在剛剛,Qwen3-Max-Thinking正式版突然發布,當即刷新全球SOTA:在涵蓋科學知識、數學推理、程式編程的19項權威基準測試中,趕上甚至超越GPT-5.2-Thinking。

技術與訓練細節

阿里正式發布千問旗艦推理模型Qwen3-Max-Thinking,模型總參數超萬億(1T),進行了更大規模的強化學習後訓練,並透過推理技術的系列創新,最終完成模型性能的大幅躍進。

預訓練資料規模高達36T Tokens,覆蓋大量高品質資料,為模型的廣泛應用奠定基礎。

關鍵測試領域

  • 科學知識:在GPQA Diamond測試中表現卓越。
  • 數學推理:在IMO-AnswerBench測試中達成高分。
  • 程式編程:在LiveCodeBench測試中展現強大能力。

市場與產業影響

Qwen3-Max-Thinking被視為迄今最接近國際頂尖水平的AI模型,其性能媲美GPT-5.2與Gemini 3 Pro,成為AI領域的重要里程碑。

來源:https://36kr.com/p/3656844553789828

返回頂端