新字型渲染攻擊手法讓AI助理誤以為網頁無害,可誘騙使用者執行惡意指令

新字型渲染攻擊手法讓AI助理誤以為網頁無害,可誘騙使用者執行惡意指令

攻擊手法簡介

資安公司LayerX揭露名為Poisoned Typeface的新型攻擊手法,攻擊者僅透過在網頁上使用自定字型與CSS樣式表,即可讓ChatGPT、Claude、Gemini等AI助理誤判網頁內容為無害,進而誘導使用者執行惡意指令。

技術機制

攻擊者利用網頁中自訂字型與CSS樣式表的渲染機制,將惡意指令隱藏於視覺上無害的字型設計中。當AI助理解析網頁內容時,會因字型渲染過程產生誤判,導致其誤以為網頁內容安全,並自動執行潛藏的惡意指令。

影響範圍

  • 影響常見AI助理,如ChatGPT、Claude與Gemini。
  • 攻擊可透過合法網址或常見網站內容執行,無需惡意軟體安裝。
  • 攻擊者可透過簡單的網頁設計,即達成誘騙效果。

防護建議

使用者應謹慎審視AI助理所呈現的網頁內容,並避免在未驗證的來源上執行自動化指令。企業亦應加強對AI代理(AI Agent)的指令驗證機制,並限制其對外部資料的自主操作權限。

來源:https://www.ithome.com.tw/news/174481

返回頂端