Google DeepMind 發布 AI-enabled pointer 實驗原型

產品發布與技術突破

近日，Google DeepMind 發布研究博客，展示由 Gemini 驅動的實驗性原型「AI-enabled pointer」。這被視為在鍵盤、鼠標、觸控屏之後，下一代人機交互技術的成形。

該原型旨在改變我們使用了 50 年且從未改變的光標。與傳統鼠標不同，AI-enabled pointer 讓光標懸停在哪裡，Gemini 就會捕獲該處的視覺信息和語義上下文。

這一步驟省去了用戶描述所見內容的需求。因為 AI 已經自動識別並理解畫面內容，用戶無需撰寫長串詳細指令。

Google 在 Google AI Studio 開放了兩個實驗 Demo，展示了其實際應用潛力。例如，當用戶只需說「修這個」時，AI 便能直接跳轉到訂票頁面進行操作，無需輸入冗長的說明。

這項技術獲得了 Google 執行長 Demis Hassabis 的高度評價，他對此表示狂讚。