OpenAI發布三款Realtime API語音模型，將GPT-5等級推理帶進即時語音互動

新語音模型介紹

OpenAI 在 Realtime API 中推出了三款新語音模型，分別是 GPT-Realtime-2、GPT-Realtime-Translate 與 GPT-Realtime-Whisper，專為即時語音互動設計，支援對話、翻譯與語音轉錄功能。

GPT-Realtime-2 是首款具備 GPT-5 等級推理能力的語音模型，專為實時互動打造。它能在對話過程中進行推理、理解使用者需求、保留前後脈絡，並在必要時調用工具完成任務，確保語音助理的對話自然流暢且具備情境意識。

OpenAI 亦計劃推出更多進階功能，包括 MCP 伺服器支援、圖像輸入與 SIP 電話通話支援，進一步擴展語音互動的應用範疇與風格化介面。