16 個月後,DeepSeek 已不是孤身走暗巷

16 個月後,DeepSeek 已不是孤身走暗巷

DeepSeek V4 重磅發佈,開啟效率革命

DeepSeek V4 是一個擁有 1.6 萬億參數的 MoE 模型,激活參數達 49B,原生支持高達 100 萬 token 的上下文長度。其核心敘事聚焦於效率革命,相較上一代 DeepSeek V3,實現了顯著性能提升。

中國開源生態蓬勃發展,競爭格局顯現

在 16 個月的等待後,Kimi K2.6 與 DeepSeek V4 在同一周相繼發佈,兩個萬億參數的開源模型並肩登場,標誌著中國大模型生態的快速演進。

在注意力機制上,DeepSeek 探索稀疏注意力架構,而 Kimi 的下一代模型則另闢蹊徑,兩者在技術路徑上形成差異化競爭,反映出中國開源 AI 模型的“惺惺相惜”與技術多樣性。

行業觀察:大模型發展面臨同質化挑戰

有分析指出,DeepSeek 與 Kimi 之間長達 16 個月的“撞車”歷史,揭示了當前大模型領域在架構設計上的趨同風險,即“R1 範式”下的同質化陷阱,值得行業深入反思。

發佈背景與時間線

原本預計在 2026 年春節上演的中國 AI 大戲,因各種因素延遲至五一假期前。2026 年 4 月 25 日,DeepSeek V4 正式發佈,引發科技圈廣泛關注。

來源:https://36kr.com/p/3784369980660996

返回頂端