絕殺!OpenAI正式接管人類耳朵,首個GPT-5級推理音頻模型來了

絕殺!OpenAI正式接管人類耳朵,首個GPT-5級推理音頻模型來了

核心突破:GPT-Realtime-2模型發佈

OpenAI於近期正式推出GPT-Realtime-2,這是首個具備GPT-5級推理能力的音頻模型,標誌著語音交互技術邁入全新階段。

技術特點與應用場景

  • 高階推理能力:模型集成了GPT-5級別的推理能力,能夠理解複雜語境、處理中斷並調用工具,實現「邊聽邊想邊做」的自然交互。
  • 人聲仿真度提升:語音合成系統實現人聲接近真人,具備毫秒級停頓控制與字級內容生成,顯著提升用戶體驗。
  • 同傳翻譯成本大幅降低:能緊跟發言人節奏的同聲傳譯,每分鐘成本降至兩毛五,對國際會議與實時溝通領域產生深遠影響。

行業影響與未來展望

該模型的推出,被視為人類與機器之間最後一道「防火牆」——鍵盤,正在徹底消失。語音交互正式進入「聽與做」的新時代,可能重塑人機交互的未來格局。

來源:https://finance.sina.cn/stock/jdts/2026-05-12/detail-inhxrwqh9901675.d.html?oid=%E6%B6%88%E6%81%AF%E7%BE%A4%E5%8F%91%E5%8A%A9%E6%89%8B%E6%80%8E%E4%B9%88%E7%94%A8%E4%B8%8D%E4%BA%86%E2%86%96%E9%9C%80%E8%A6%81%E8%81%94%E7%B3%BBTG:@HHCH8%E6%92%9E%E5%BA%93%E6%95%B0%E6%8D%AE%E6%B8%97%E9%80%8F%E6%95%B0%E6%8D%AE%E6%B5%B7%E5%A4%96%E6%94%AF%E4%BB%98%E9%80%9A%E9%81%93%E2%86%97FeOS&vt=4&cid=76993&node_id=76993

返回頂端