OpenAI 推出新語音智慧功能於其 API
新語音模型強化推理與自然語音表現
OpenAI 在其 Realtime API 中推出新的語音到語音模型,展現更強的推理能力與更自然的語音表現,能夠處理複雜的多步驟請求,例如根據生活需求篩選商品清單,或透過「BuyAbility」評分工具討論價格合理性。
支援語音轉文字與文字轉語音功能
新推出的語音轉文字與文字轉語音模型,讓開發者能建置更強大且可客製化的語音應用,例如即時會議筆記、語音互動流程與工作流更新。
適用於多領域應用場景
- 客戶服務系統:提供即時語音互動與問題解決。
- 教育平臺:支援語音教學與學習內容的互動。
- 創作者平臺:協助內容創作與語音內容生成。
相關技術與發展進度
OpenAI 於 2024 年 10 月推出 Realtime API,其技術基礎與 ChatGPT 的先進語音模式一致,目前已進入生產環境,並持續優化語音互動體驗。
來源:https://techcrunch.com/2026/05/07/openai-launches-new-voice-intelligence-features-in-its-api/
