Mistral 推出新一代開放原始碼語音生成模型
產品介紹
Mistral AI 推出 Voxtral 系列語音模型,包含 Voxtral Transcribe 2 與 Voxtral Mini Transcribe V2,為新一代語音轉文字模型,專為即時語音轉錄與多語言語音理解設計。
技術特色
- 語音轉錄品質超越現有開源模型,如 Whisper large-v3。
- 支援即時語音轉錄與語音分離(diarization),適用於多語境環境。
- 模型可於智慧型手機或智慧手錶等裝置上運行,無需依賴雲端服務。
- 提供多語言語音轉譯功能,支援跨語系語音理解。
發布資訊
該模型於 2025 年 7 月 15 日首次發布,並於 2026 年 2 月 4 日推出 Voxtral Transcribe 2 的升級版本,強化語音處理效能與準確度。
來源:https://techcrunch.com/2026/03/26/mistral-releases-a-new-open-source-model-for-speech-generation/
