Google I/O全盤點:兩大新模型上線,音頻眼鏡登臺,Gemini接管一切

Google I/O全盤點:兩大新模型上線,音頻眼鏡登臺,Gemini接管一切

新模型發佈:Gemini 2.5 Pro與多模態大模型

在2025年Google I/O大會上,谷歌推出了Gemini 2.5 Pro,這是Gemini系列最新的推理旗艦模型,對標OpenAI o3。相較於Gemini 2.5,Gemini 2.5 Pro在複雜任務處理能力上顯著增強,尤其在代碼生成、多模態理解與任務執行方面表現突出。

此外,谷歌還發布了Gemini Diffusion擴散語言模型,首次將擴散模型應用於AI,提升問題回答的效率與準確性,並已面向部分用戶進行測試。

AI語音與音頻眼鏡技術亮相

谷歌展示了其AI語音技術的突破,TTS(文字轉語音)功能讓AI生成的語音更加自然,幾乎與真人無異,顯著提升了用戶體驗。

在硬件方面,谷歌推出了AR音頻眼鏡,結合AI能力,實現沉浸式交互體驗,標誌著AI穿戴設備的進一步發展。

Gemini全面接管AI生態

Google宣佈Gemini將全面接管其AI生態,包括搜索、AI助手與各類應用服務。Gemini不僅成為核心AI助手,更被整合為“通用代理”(General Agent),可自主調用搜索、代碼執行及第三方服務,實現端到端的智能任務處理。

谷歌進一步推出Gemini訂閱計劃,AI Pro用戶可月付19.99美元,獲得更高級別的AI功能與服務。

未來展望:AI與XR融合趨勢

Google I/O 2025揭示了未來數位職場的技能轉型趨勢,AI與XR(擴展現實)技術的結合成為重點發展方向。未來,Gemini將深度整合至Android系統與Google XR產品線,推動跨平臺智能體驗。

來源:https://36kr.com/p/3816765912883200

返回頂端