機器學習中的數據投毒：人們為何以及如何操縱訓練數據

什麼是數據投毒？

數據投毒是指攻擊者通過在機器學習模型的訓練數據集中注入精心設計的惡意樣本，從而改變模型的學習過程和行為。這種攻擊方式會破壞模型的準確性與可靠性，使模型在實際應用中產生錯誤預測。

數據投毒通常源於惡意意圖，例如破壞系統功能、竊取敏感信息或製造虛假決策。在某些場景下，攻擊者可能利用數據投毒來實現對人工智能系統的控制，例如在自動駕駛或金融決策系統中植入後門。

防範措施包括：對訓練數據進行完整性校驗、引入數據清洗流程、使用去中心化或加密訓練機制、建立異常檢測系統，以及在模型訓練過程中加入魯棒性測試。