V3 到 V4,DeepSeek 484 天的人、財、事、物
人:人才分流與技術路線的轉變
那個靠低成本神話出圈的團隊,開始談融資。那個拒絕VC、拒絕上市、靠幻方量化輸血的實驗室,開始被騰訊和阿里圍在牌桌中間。
財:557萬美元的神話與真實賬單
557萬美元的神話,終究要補全真實賬單,反映出早期投入與後續資金需求之間的落差。
事:開源底座成為行業通用武器
開源底座成了全行業的“通用武器”,成為推動AI技術普及與協作的重要基礎。
物:從H800到昇騰的算力演進
從H800到昇騰,DeepSeek在算力硬件層面持續演進,強化了其在實際部署中的可行性與效率。
技術升級細節
- 引入mHC(Manifold-Constrained Hyper-Connections)強化殘差連接。
- 設計hybrid attention架構,結合CSA和其它機制,提升模型性能。
