Google 的新「任何到任何」AI 模型令人驚豔
Google 推出 Gemini Omni 模型,實現「任何輸入創造任何輸出」
Google 最新的 AI 模型 Gemini Omni,能夠根據任何輸入內容生成各種形式的輸出,從文字、圖片到影片皆可創造,展現強大的多模態能力。
首個模型 Gemini Omni Flash 已正式推出
作為 Gemini Omni 家族的首個模型,Gemini Omni Flash 已於近期正式上線,提供初步的 AI 生成功能,包括高品質的生成影片與互動式內容。
強化多模態與推理能力
- AI Mode 支援多種輸入方式,如文字、語音、照片或影像,能深入理解使用者需求。
- 結合 Gemini 的先進智能與生成媒體模型,實現更自然、更直觀的內容創作。
- 支援追加問題與上下文維持,讓搜尋體驗更深入與互動。
相關應用與未來發展
Google 在 Google I/O 2026 上推出多項新工具,包括強化版的 Gemini API 與 Google Antigravity,並提供原生 Android 支援,讓開發者能將想法從提示(prompt)轉化為實際應用。
此外,Google 也強調其 AI 模型在生成影片與重建真實影像方面,達到 90% 的真實度,顯示其技術進步。
來源:https://www.theverge.com/tech/936507/gemini-omni-hands-on-deepfake-ai-video
