DeepSeek開源V4預覽版,支援100萬Token的脈絡長度
模型重點與技術特色
中國AI新創DeepSeek上週發表並開源了DeepSeek-V4預覽版,宣稱新版本可支援100萬個Token的脈絡長度,大幅提升代理人(Agent)能力,性能可比美頂級的閉源模型。
模型版本與參數配置
- DeepSeek-V4-Pro:總參數達1.6兆(1.6T),啟動參數為49B,為高規格版本,適合需要強大知識與推理能力的應用。
- DeepSeek-V4-Flash:總參數為284B,啟動參數為13B,雖在世界知識儲備上略遜於Pro版本,但推理能力仍維持在高水準,適合高頻率與高效能需求。
應用場景與產業意義
DeepSeek-V4支援100萬Token脈絡長度,意味著AI可處理如完整書籍、大型合約、完整商業報表或大型程式碼專案等內容,實現真正深度理解與分析。
此技術進展也展現中國AI產業鏈自主化,有助於減少對NVIDIA晶片的依賴,並強化AI代理在多步驟任務中的能力。
