超越DeepSeek-V4,羅福莉交出小米最強開源模型,首日適配5家國產芯片
模型介紹與技術細節
小米AI負責人羅福莉帶隊研發的MiMo-V2.5-Pro模型,為一款擁有1.02兆(1.02T)個參數的混合專家架構(MoE)模型,其中420億(42B)個啟動參數,基於混合注意力機制設計。
首日適配國產芯片
MiMo-V2.5-Pro模型在開源首日即完成與多個國產芯片廠商的接入適配,包括阿里平頭哥、亞馬遜雲科技、AMD、百度昆侖芯、燧原科技、沐曦、天數智芯等,實現了對多種國產算力平臺的支援。
免費Token激勵計畫
小米同步推出100兆Token免費激勵計畫,鼓勵開發者與企業使用該模型進行開發與實測,並支援商業部署與二次訓練。
技術與產業意義
此舉被視為國產AI生態發展的重要里程碑,不僅推動了開源大模型在國產算力上的應用,也體現了小米在AI領域的技術投入與產業佈局。
來源:https://cj.sina.com.cn/articles/view/5953466437/162dab0450670ahfvq?froms=ggmp
