DeepSeek:輸入等字符觸發返回異常內容屬於特殊字符引發的模型幻覺,不涉及安全問題或隱私洩露
事件背景
近期有用戶反饋,在與DeepSeek模型的對話中輸入特定特殊字符(如未閉合的標籤)後,模型偶發返回不可預期的內容,引發部分用戶對「對話內容洩露」的疑慮。
技術說明
- DeepSeek技術團隊經全面排查後指出,此類異常回復屬於「特殊字符引發的模型幻覺」,並非真實數據洩露或安全漏洞。
- 模型在處理未閉合標籤或異常輸入時,可能因訓練數據中的模式匹配而產生不符合事實或上下文的內容,此現象被歸類為「幻覺」。
- 該問題不涉及用戶隱私數據的洩露,亦未違反會話隔離機制。
後續措施
DeepSeek表示,將通過針對性訓練強化模型對特殊字符的識別與處理能力,修復已知問題,並優化模型在異常輸入場景下的表現。
相關討論與背景
儘管DeepSeek明確指出該問題屬於模型幻覺,但其他技術文章與社區討論仍關注到類似輸入可能引發的會話內存洩露或跨用戶數據汙染風險,例如在GitHub議題中提及使用
此外,部分分析指出大模型在處理政治敏感詞彙或特殊提示詞時,可能產生不安全的輸出,或引發隱私風險,凸顯模型在輸入控制與安全過濾上的挑戰。
來源:https://www.panewslab.com/zh/articles/019e3fe7-e1da-746a-a947-b1037b05081f
