姚順雨率領團隊三月重構混元,Hy3 preview 模型正式上線

姚順雨率領團隊三月重構混元,Hy3 preview 模型正式上線

混元大模型重構啟動與 Hy3 preview 發布

4 月 23 日,騰訊正式對外發布並開源了混元 Hy3 Preview 語言模型。該模型由首席 AI 科學家姚順雨主導,在經歷內部戰略調整後推出,這是混元大模型從「讀萬卷書」走向「行萬里路」,嘗試解決真實世界問題的一個開端。

研發週期與技術架構

從研發節奏來看,Hy3 preview 於 2026 年 1 月底正式啟動訓練,從訓練到上線僅用了不到三個月的時間,被騰訊內部定義為執行力在線的表現。該模型採用快慢思考融合的混合專家(MoE)架構,總參數為 295B,激活參數為 21B,並具備 256K 上下文窗口。

模型能力與應用場景

Hy3 preview 已接入騰訊全系產品,包括「元寶」等應用。模型在聊天、程式碼生成、智能體、數理推理、指令遵循及上下文理解等方面進行了優化。根據盲評測試,該模型在 55% 到 56% 的勝率範圍內,顯示其具備基本可用能力,但距離與第一梯隊模型拉開差距仍有空間。

市場反應與競爭格局

姚順雨執掌騰訊混元後的首秀,最終被 DeepSeek-V4 的討論淹沒。儘管騰訊在重構基礎設施、預訓練及強化學習方面投入了大量資源,但該模型的發布並未立即引發市場對騰訊大模型動作變慢的關注,反而被視為其出牌方式改變的嘗試。

來源:https://36kr.com/p/3779304234701831

返回頂端