GoPlus 揭露 AI 代理「歷史記憶授權」攻擊漏洞
攻擊機制與發現
PANews 5 月 15 日消息,據 GoPlus 披露,其 AgentGuard 團隊發現一種隱蔽的攻擊方式,稱為「歷史記憶授權」攻擊。攻擊者先誘導 AI 代理記住「更傾向於主動退款」等偏好,隨後透過「按老規矩處理」、「照常處理」等模糊表述,成功觸發資金操作。
高危行為防護建議
針對此類高危行為,專家提出以下防護措施:
- 退款、轉帳、刪除、發信、同步敏感配置:必須要求當前會話顯式確認。
- 涉及「習慣」、「偏好」、「老規矩」的記憶寫入:要視為高風險狀態修改。
- 長期記憶必須可追溯:需記錄誰寫的、什麼時候寫的、是否經確認。
- 模糊表述風險提升:「照常處理」、「按以前那樣來」等表述,應預設提高風險等級。
- 禁止長期記憶替代當前授權:確保每次操作都有即時授權。
