Mistral發表Voxtral Transcribe 2系列模型，即時語音轉文字延遲可低於200毫秒

即時語音轉文字模型Voxtral Realtime

法國人工智慧新創Mistral推出語音轉文字模型家族Voxtral Transcribe 2，鎖定會議逐字稿、客服通話與即時語音互動等需求。該系列新增即時模型Voxtral Realtime，官方表示轉錄延遲可設定到200毫秒以下，讓即時互動更貼近對話節奏。

在批次模型Voxtral Mini Transcribe V2中，加入了說話者分離與詞級時間戳記等能力，強化會議與多方通話整理需求，提升語音內容的結構化與可讀性。

該模型系列已開放給開發者使用，並支援在Amazon SageMaker等平臺進行部署，適用於語音串流場景。