6萬張國產卡訓出萬億模型,LongCat與DeepSeek驗證了什麼

6萬張國產卡訓出萬億模型,LongCat與DeepSeek驗證了什麼

國產算力取得重大突破

據悉,DeepSeek-V4已完成對華為昇騰、寒武紀等主流國產AI芯片的全棧深度適配;而LongCat-2.0-Preview的訓練與推理,全程依託國產算力集群獨立完成,是目前唯一一個在訓練與推理階段完全使用國產算力的大模型。

模型參數規模與性能表現

美團新一代基礎大模型LongCat-2.0-Preview已開放測試,其總參數規模突破萬億,總參數量決定了大模型的知識容量上限及存儲成本。該模型支持1M上下文窗口,單次推理可吞吐百萬字輸入,性能表現與DeepSeek-V4相當。

行業意義與技術驗證

此次LongCat與DeepSeek的發佈,標誌著國產AI大模型在訓練與推理環節已具備與國際先進水平相媲美的能力,驗證了國產算力在支撐萬億參數大模型方面已通過第一場關鍵大考。

相關資訊鏈接

來源:https://36kr.com/p/3784668781714689

返回頂端