姚順雨率領團隊三月重構混元,Hy3 preview 模型正式上線
混元大模型重構啟動與 Hy3 preview 發布
4 月 23 日,騰訊正式對外發布並開源了混元 Hy3 Preview 語言模型。該模型由首席 AI 科學家姚順雨主導,在經歷內部戰略調整後推出,這是混元大模型從「讀萬卷書」走向「行萬里路」,嘗試解決真實世界問題的一個開端。
研發週期與技術架構
從研發節奏來看,Hy3 preview 於 2026 年 1 月底正式啟動訓練,從訓練到上線僅用了不到三個月的時間,被騰訊內部定義為執行力在線的表現。該模型採用快慢思考融合的混合專家(MoE)架構,總參數為 295B,激活參數為 21B,並具備 256K 上下文窗口。
模型能力與應用場景
Hy3 preview 已接入騰訊全系產品,包括「元寶」等應用。模型在聊天、程式碼生成、智能體、數理推理、指令遵循及上下文理解等方面進行了優化。根據盲評測試,該模型在 55% 到 56% 的勝率範圍內,顯示其具備基本可用能力,但距離與第一梯隊模型拉開差距仍有空間。
市場反應與競爭格局
姚順雨執掌騰訊混元後的首秀,最終被 DeepSeek-V4 的討論淹沒。儘管騰訊在重構基礎設施、預訓練及強化學習方面投入了大量資源,但該模型的發布並未立即引發市場對騰訊大模型動作變慢的關注,反而被視為其出牌方式改變的嘗試。
