羅福莉又上分了!小米連甩 4 款模型,讓 AI 超逼真配音

小米 MiMo-V2.5 系列模型全數亮相,羅福莉再創佳績

小米發布四款新語音模型

小米近日正式發布了 MiMo-V2.5 系列中的四款新模型,進一步強化其 AI 生態系統。這些新模型由前深度求索(DeepSeek)研究員羅福莉主導開發,旨在提升 AI 在真實場景中的應用能力。

語音模型功能亮點

  • MiMo-V2.5-TTS:此文本轉語音模型集成了多款音色,支持「一話複刻」功能,允許用戶複製特定人物的語音風格,並可定製全新音色。
  • MiMo-V2.5-ASR:此語音識別模型支援中英雙語、中文方言、強噪音環境及多說話人識別,適用於複雜的真實場景。
  • 其他模型:系列中還包含其他三款模型,共同構成完整的語音處理解決方案。

雷軍與羅福莉的回應

小米創辦人雷軍在社交媒體上發文稱,小米 AI 模型「繼續進步」,肯定團隊的研發成果。羅福莉則強調,此次模型的發布並非事先策劃,而是一場「悄無聲息的伏擊」,指出 AI 形態正從聊天模式快速轉變為智能代理模式。

技術授權與商業應用

小米 MiMo-V2.5 系列模型採用 MIT 開源授權,允許商業部署與二次訓練。旗艦模型 MiMo-V2.5-Pro 擁有 10.2 億參數及 100 萬 Token 上下文,展現出強大的推理與處理能力。

來源:https://36kr.com/p/3780358587946246

返回頂端