DeepSeek V4 成本暴降 73%，梁文鋒聯手華為寒武紀，源神歸位

DeepSeek V4 模型發布與成本優勢

深度求索（DeepSeek）於 2026 年 4 月 24 日發布了新一代大模型 DeepSeek V4，該模型被稱為「源神」，其影響力迅速引發關注，在微博熱搜榜前五佔據三席。此次發布包含兩款模型：DeepSeek-V4-Pro 與 DeepSeek-V4-Flash。

根據官方資訊，DeepSeek V4 系列模型總參數規模達到 1.6T（其中激活參數為 49B 與 284B），並統一支持最長 100 萬 token 的上下文窗口。與以往版本相比，該系列模型在推理成本上實現了顯著下降，被報導成本暴降 73% 至 75%。

DeepSeek V4 在英偉達 GPU 與華為昇騰 NPU 平臺上驗證了細粒度專家並行（EP）方案，與性能較強的非融合基線相比，在通用推理任務中實現了約 1.50-1.73 倍的效率提升。此技術突破使得模型能夠在保持高性能的同時大幅降低運算成本。

此次發布標誌著梁文鋒與華為寒武紀的緊密合作，雙方共同推動了算力基礎設施的整合，實現了部分算力脫鉤，並為模型在華為昇騰生態系統中的部署奠定了基礎。

DeepSeek-V4-Pro 主打性能上限，旨在對標閉源旗艦模型；而 DeepSeek-V4-Flash 則在參數規模與激活規模上大幅縮小，換取更低延遲與更低成本，適合對速度與成本敏感的使用場景。

隨著 DeepSeek V4 的推出，市場對開源大模型的關注度進一步提升，其 API 價格策略也引發了廣泛討論，有報導指出 DeepSeek 官網已更新 API 文檔，宣佈 DeepSeek-V4-Pro 開啟 2.5 折限時優惠，進一步拉低了 token 使用成本。