Mistral 推出新一代開放原始碼語音生成模型

Mistral 推出新一代開放原始碼語音生成模型

產品介紹

Mistral AI 推出 Voxtral 系列語音模型,包含 Voxtral Transcribe 2 與 Voxtral Mini Transcribe V2,為新一代語音轉文字模型,專為即時語音轉錄與多語言語音理解設計。

技術特色

  • 語音轉錄品質超越現有開源模型,如 Whisper large-v3。
  • 支援即時語音轉錄與語音分離(diarization),適用於多語境環境。
  • 模型可於智慧型手機或智慧手錶等裝置上運行,無需依賴雲端服務。
  • 提供多語言語音轉譯功能,支援跨語系語音理解。

發布資訊

該模型於 2025 年 7 月 15 日首次發布,並於 2026 年 2 月 4 日推出 Voxtral Transcribe 2 的升級版本,強化語音處理效能與準確度。

來源:https://techcrunch.com/2026/03/26/mistral-releases-a-new-open-source-model-for-speech-generation/

返回頂端