Google 的新「任何到任何」AI 模型令人驚豔

Google 的新「任何到任何」AI 模型令人驚豔

Google 推出 Gemini Omni 模型,實現「任何輸入創造任何輸出」

Google 最新的 AI 模型 Gemini Omni,能夠根據任何輸入內容生成各種形式的輸出,從文字、圖片到影片皆可創造,展現強大的多模態能力。

首個模型 Gemini Omni Flash 已正式推出

作為 Gemini Omni 家族的首個模型,Gemini Omni Flash 已於近期正式上線,提供初步的 AI 生成功能,包括高品質的生成影片與互動式內容。

強化多模態與推理能力

  • AI Mode 支援多種輸入方式,如文字、語音、照片或影像,能深入理解使用者需求。
  • 結合 Gemini 的先進智能與生成媒體模型,實現更自然、更直觀的內容創作。
  • 支援追加問題與上下文維持,讓搜尋體驗更深入與互動。

相關應用與未來發展

Google 在 Google I/O 2026 上推出多項新工具,包括強化版的 Gemini API 與 Google Antigravity,並提供原生 Android 支援,讓開發者能將想法從提示(prompt)轉化為實際應用。

此外,Google 也強調其 AI 模型在生成影片與重建真實影像方面,達到 90% 的真實度,顯示其技術進步。

來源:https://www.theverge.com/tech/936507/gemini-omni-hands-on-deepfake-ai-video

返回頂端