Google DeepMind 發布 AI-enabled pointer 實驗原型
產品發布與技術突破
近日,Google DeepMind 發布研究博客,展示由 Gemini 驅動的實驗性原型「AI-enabled pointer」。這被視為在鍵盤、鼠標、觸控屏之後,下一代人機交互技術的成形。
技術原理與運作方式
該原型旨在改變我們使用了 50 年且從未改變的光標。與傳統鼠標不同,AI-enabled pointer 讓光標懸停在哪裡,Gemini 就會捕獲該處的視覺信息和語義上下文。
這一步驟省去了用戶描述所見內容的需求。因為 AI 已經自動識別並理解畫面內容,用戶無需撰寫長串詳細指令。
實際應用案例
Google 在 Google AI Studio 開放了兩個實驗 Demo,展示了其實際應用潛力。例如,當用戶只需說「修這個」時,AI 便能直接跳轉到訂票頁面進行操作,無需輸入冗長的說明。
這項技術獲得了 Google 執行長 Demis Hassabis 的高度評價,他對此表示狂讚。
