谷歌AGI底座降臨!首個原生全模態嵌入模型上線,已實現全模態SOTA

谷歌AGI底座降臨!首個原生全模態嵌入模型上線,已實現全模態SOTA

模型介紹與功能

谷歌發布了首個原生全模態Embedding模型——Gemini Embedding 2,該模型將文本、圖像、音視頻及PDF無損融於統一向量空間,實現跨越五大模態的直接檢索。

技術突破與應用

  • 此模型作為首個原生全模態Embedding模型,突破傳統模態分離限制,實現多模態資料的高效整合。
  • 其嵌入空間設計允許不同模態資料在單一空間中進行向量對齊,提升跨模態檢索的準確性與一致性。
  • 該技術可廣泛應用於搜尋引擎、內容推薦、知識庫管理等場景,特別是對多種格式文件(如PDF)的整合檢索。

來源資訊

資訊源自多個媒體平臺,包括51CTO、新浪財經與新智元,內容一致且時效性強。

來源:https://36kr.com/p/3719350918280580

返回頂端