DeepSeek V4 終於發布,打破最強閉源壟斷,明確攜手華為晶片
模型發布與核心參數
DeepSeek-V4 新模型於 4 月 24 日正式發布,其預覽版上線並同步開源。該模型共有兩個版本:DeepSeek-V4-Pro 與 DeepSeek-V4-Flash。
- DeepSeek-V4-Pro:參數規模為 1.6T,激活參數 49B,上下文長度達 1M,旨在對標頂級閉源模型。
- DeepSeek-V4-Flash:參數規模為 284B,激活參數 13B,上下文長度同樣為 1M。
性能表現與能力評估
官方表示,新模型在多個維度上實現了國內與開源領域的領先:
- Agent 能力:在編程評測中,該版本已達到當前開源模型最佳水平。
- 世界知識:大幅領先其他開源模型,僅稍遜於頂尖閉源模型 Gemini-Pro-3.1。
- 數學與 STEM:在數學及科學技術領域表現優異。
硬體生態與戰略合作
DeepSeek V4 明確宣佈將支持華為昇騰晶片,這被視為中國 AI 打破英偉達壟斷的重要一步。
- 此前市場擔憂若僅能運行於英偉達晶片,「國產最強開源模型」的標籤將顯得不足。
- 現在模型成功跑通昇騰晶片,完成了從算法到硬體生態的完整敘事。
- 官方明確了下半年對華為算力的支持計劃。
此舉被視為美國黃仁勛最擔心之事發生,標誌著卡脖子時代過去,白菜價時代來臨。
