V3 到 V4,DeepSeek 484 天的人、財、事、物

V3 到 V4,DeepSeek 484 天的人、財、事、物

人:人才分流與技術路線的轉變

那個靠低成本神話出圈的團隊,開始談融資。那個拒絕VC、拒絕上市、靠幻方量化輸血的實驗室,開始被騰訊和阿里圍在牌桌中間。

財:557萬美元的神話與真實賬單

557萬美元的神話,終究要補全真實賬單,反映出早期投入與後續資金需求之間的落差。

事:開源底座成為行業通用武器

開源底座成了全行業的“通用武器”,成為推動AI技術普及與協作的重要基礎。

物:從H800到昇騰的算力演進

從H800到昇騰,DeepSeek在算力硬件層面持續演進,強化了其在實際部署中的可行性與效率。

技術升級細節

  • 引入mHC(Manifold-Constrained Hyper-Connections)強化殘差連接。
  • 設計hybrid attention架構,結合CSA和其它機制,提升模型性能。

來源:https://36kr.com/p/3784510654503943

返回頂端