DeepSeek V4 成本暴降 73%,梁文鋒聯手華為寒武紀,源神歸位
DeepSeek V4 模型發布與成本優勢
深度求索(DeepSeek)於 2026 年 4 月 24 日發布了新一代大模型 DeepSeek V4,該模型被稱為「源神」,其影響力迅速引發關注,在微博熱搜榜前五佔據三席。此次發布包含兩款模型:DeepSeek-V4-Pro 與 DeepSeek-V4-Flash。
根據官方資訊,DeepSeek V4 系列模型總參數規模達到 1.6T(其中激活參數為 49B 與 284B),並統一支持最長 100 萬 token 的上下文窗口。與以往版本相比,該系列模型在推理成本上實現了顯著下降,被報導成本暴降 73% 至 75%。
技術架構與合作夥伴
DeepSeek V4 在英偉達 GPU 與華為昇騰 NPU 平臺上驗證了細粒度專家並行(EP)方案,與性能較強的非融合基線相比,在通用推理任務中實現了約 1.50-1.73 倍的效率提升。此技術突破使得模型能夠在保持高性能的同時大幅降低運算成本。
此次發布標誌著梁文鋒與華為寒武紀的緊密合作,雙方共同推動了算力基礎設施的整合,實現了部分算力脫鉤,並為模型在華為昇騰生態系統中的部署奠定了基礎。
產品定位與市場影響
DeepSeek-V4-Pro 主打性能上限,旨在對標閉源旗艦模型;而 DeepSeek-V4-Flash 則在參數規模與激活規模上大幅縮小,換取更低延遲與更低成本,適合對速度與成本敏感的使用場景。
隨著 DeepSeek V4 的推出,市場對開源大模型的關注度進一步提升,其 API 價格策略也引發了廣泛討論,有報導指出 DeepSeek 官網已更新 API 文檔,宣佈 DeepSeek-V4-Pro 開啟 2.5 折限時優惠,進一步拉低了 token 使用成本。
