阿里最強全模態模型登場,實測看懂50分鐘《老友記》,全球評測215項SOTA
模型性能與技術亮點
千問團隊在技術博客中稱,在215項音頻/音視頻的理解、推理和交互任務上,Qwen3.5-Omni-Plus取得了SOTA成績。這一模型的通用音頻理解、推理、識別、翻譯、對話等能力均表現突出,展現了其在多模態場景下的強大潛力。
實測案例
該模型已實測能夠看懂50分鐘《老友記》的完整內容,展現出在長視頻理解與情境推理方面的卓越能力,可精準捕捉對話細節與人物關係。
性能對比
部分性能已超越Gemini-3.1 Pro,顯示出在特定任務上的領先優勢,尤其在音視頻理解與跨模態交互方面。
