Google I/O全盤點:兩大新模型上線,音頻眼鏡登臺,Gemini接管一切
新模型發佈:Gemini 2.5 Pro與多模態大模型
在2025年Google I/O大會上,谷歌推出了Gemini 2.5 Pro,這是Gemini系列最新的推理旗艦模型,對標OpenAI o3。相較於Gemini 2.5,Gemini 2.5 Pro在複雜任務處理能力上顯著增強,尤其在代碼生成、多模態理解與任務執行方面表現突出。
此外,谷歌還發布了Gemini Diffusion擴散語言模型,首次將擴散模型應用於AI,提升問題回答的效率與準確性,並已面向部分用戶進行測試。
AI語音與音頻眼鏡技術亮相
谷歌展示了其AI語音技術的突破,TTS(文字轉語音)功能讓AI生成的語音更加自然,幾乎與真人無異,顯著提升了用戶體驗。
在硬件方面,谷歌推出了AR音頻眼鏡,結合AI能力,實現沉浸式交互體驗,標誌著AI穿戴設備的進一步發展。
Gemini全面接管AI生態
Google宣佈Gemini將全面接管其AI生態,包括搜索、AI助手與各類應用服務。Gemini不僅成為核心AI助手,更被整合為“通用代理”(General Agent),可自主調用搜索、代碼執行及第三方服務,實現端到端的智能任務處理。
谷歌進一步推出Gemini訂閱計劃,AI Pro用戶可月付19.99美元,獲得更高級別的AI功能與服務。
未來展望:AI與XR融合趨勢
Google I/O 2025揭示了未來數位職場的技能轉型趨勢,AI與XR(擴展現實)技術的結合成為重點發展方向。未來,Gemini將深度整合至Android系統與Google XR產品線,推動跨平臺智能體驗。
