Google I/O全盤點：兩大新模型上線，音頻眼鏡登臺，Gemini接管一切

新模型發佈：Gemini 2.5 Pro與多模態大模型

在2025年Google I/O大會上，谷歌推出了Gemini 2.5 Pro，這是Gemini系列最新的推理旗艦模型，對標OpenAI o3。相較於Gemini 2.5，Gemini 2.5 Pro在複雜任務處理能力上顯著增強，尤其在代碼生成、多模態理解與任務執行方面表現突出。

此外，谷歌還發布了Gemini Diffusion擴散語言模型，首次將擴散模型應用於AI，提升問題回答的效率與準確性，並已面向部分用戶進行測試。

谷歌展示了其AI語音技術的突破，TTS（文字轉語音）功能讓AI生成的語音更加自然，幾乎與真人無異，顯著提升了用戶體驗。

在硬件方面，谷歌推出了AR音頻眼鏡，結合AI能力，實現沉浸式交互體驗，標誌著AI穿戴設備的進一步發展。

Google宣佈Gemini將全面接管其AI生態，包括搜索、AI助手與各類應用服務。Gemini不僅成為核心AI助手，更被整合為“通用代理”（General Agent），可自主調用搜索、代碼執行及第三方服務，實現端到端的智能任務處理。

谷歌進一步推出Gemini訂閱計劃，AI Pro用戶可月付19.99美元，獲得更高級別的AI功能與服務。

Google I/O 2025揭示了未來數位職場的技能轉型趨勢，AI與XR（擴展現實）技術的結合成為重點發展方向。未來，Gemini將深度整合至Android系統與Google XR產品線，推動跨平臺智能體驗。