那個用半成品刷爆SOTA的Qwen3超大杯推理版,現在正式上線
模型發布與性能突破
就在剛剛,Qwen3-Max-Thinking正式版突然發布,當即刷新全球SOTA:在涵蓋科學知識、數學推理、程式編程的19項權威基準測試中,趕上甚至超越GPT-5.2-Thinking。
技術與訓練細節
阿里正式發布千問旗艦推理模型Qwen3-Max-Thinking,模型總參數超萬億(1T),進行了更大規模的強化學習後訓練,並透過推理技術的系列創新,最終完成模型性能的大幅躍進。
預訓練資料規模高達36T Tokens,覆蓋大量高品質資料,為模型的廣泛應用奠定基礎。
關鍵測試領域
- 科學知識:在GPQA Diamond測試中表現卓越。
- 數學推理:在IMO-AnswerBench測試中達成高分。
- 程式編程:在LiveCodeBench測試中展現強大能力。
市場與產業影響
Qwen3-Max-Thinking被視為迄今最接近國際頂尖水平的AI模型,其性能媲美GPT-5.2與Gemini 3 Pro,成為AI領域的重要里程碑。
