DeepSeek V4 終於來了，我們知道什麼？

產品發布與核心規格

DeepSeek-V4 的預覽版本於 2026 年 4 月 24 日正式上線並同步開源。該系列模型標榜「邁入百萬上下文普惠時代」，擁有 1M token 的超長上下文能力。在技術細節上，官方披露了訓練細節但未明確硬體配置，不過有報導指出其明確攜手華為芯片，並被寫入相關技術文檔。

此次發布包含兩個版本：DeepSeek-V4-Pro 與基礎版。其中 DeepSeek-V4-Pro 被視為目前公開權重最大的模型，參數規模達 1.6T，激活參數為 49B，上下文長度為 1M，性能對標頂級閉源模型。

在初期評測中，DeepSeek-V4 在非創作類任務上的表現優於編程任務，且被內部員工用於 Agentic Coding，交付質量接近 Opus 4.6 非思考模式，使用體驗優於 Sonnet 4.5。

模型在 Agent 能力、世界知識和推理性能上均實現了顯著提升。此外，輸入框新增了「快速模式」與「專家模式」，快速模式適合日常對話與即時響應，支持圖片和文件中的文字識別；專家模式則擅長處理複雜任務。

該模型採用 mHC 架構，解決了大模型訓練不穩定的難題，並具備多模態能力，旨在為大模型國產算力時代做準備。