DeepSeek V4 終於來了,我們知道什麼?

DeepSeek V4 終於來了,我們知道什麼?

產品發布與核心規格

DeepSeek-V4 的預覽版本於 2026 年 4 月 24 日正式上線並同步開源。該系列模型標榜「邁入百萬上下文普惠時代」,擁有 1M token 的超長上下文能力。在技術細節上,官方披露了訓練細節但未明確硬體配置,不過有報導指出其明確攜手華為芯片,並被寫入相關技術文檔。

模型版本與性能表現

此次發布包含兩個版本:DeepSeek-V4-Pro 與基礎版。其中 DeepSeek-V4-Pro 被視為目前公開權重最大的模型,參數規模達 1.6T,激活參數為 49B,上下文長度為 1M,性能對標頂級閉源模型。

在初期評測中,DeepSeek-V4 在非創作類任務上的表現優於編程任務,且被內部員工用於 Agentic Coding,交付質量接近 Opus 4.6 非思考模式,使用體驗優於 Sonnet 4.5。

功能升級與多模態能力

模型在 Agent 能力、世界知識和推理性能上均實現了顯著提升。此外,輸入框新增了「快速模式」與「專家模式」,快速模式適合日常對話與即時響應,支持圖片和文件中的文字識別;專家模式則擅長處理複雜任務。

該模型採用 mHC 架構,解決了大模型訓練不穩定的難題,並具備多模態能力,旨在為大模型國產算力時代做準備。

返回頂端