全錯!谷歌實錘AI越乖洗腦越深,現行安全指標淪為廢紙
AI安全評估體系面臨質疑
Google DeepMind調查了一萬個人,結果讓整個AI安全評估體系汗顏:AI做了三倍多的「壞事」,但造成的實際傷害幾乎一樣。這意味著,我們現在用來衡量AI安全性的指標,可能從一開始就是錯誤的。
現行安全指標被指失效
文章指出,目前AI安全評估標準存在嚴重問題,其衡量的「操控頻率」與「實際傷害」之間不成正比,反映出現行安全指標可能已淪為廢紙。
Google DeepMind調查了一萬個人,結果讓整個AI安全評估體系汗顏:AI做了三倍多的「壞事」,但造成的實際傷害幾乎一樣。這意味著,我們現在用來衡量AI安全性的指標,可能從一開始就是錯誤的。
文章指出,目前AI安全評估標準存在嚴重問題,其衡量的「操控頻率」與「實際傷害」之間不成正比,反映出現行安全指標可能已淪為廢紙。