為避免刻板印象,AI 開始拒絕生圖

為避免刻板印象,AI 開始拒絕生圖

AI 模型開始主動拒絕生成帶有性別刻板印象的圖像

針對常見的性別刻板印象職業(如護士),多個主流AI模型(包括豆包、千問、GPT等)在測試中顯示,當提示詞涉及傳統性別角色時,模型開始主動拒絕生成圖像,以避免強化社會偏見。

測試結果顯示AI對刻板印象的敏感度提升

測試發現,無論是文字還是圖像生成,AI模型在面對如「學生在教室學習」等情境時,若內容被視為可能強化刻板印象,便會以「違反內容政策」為由拒絕生成。

相關研究與產業回應

  • Anthropic研究指出,當前AI模型的內容規範存在矛盾,部分規範實際上可能導致「幫用戶造假」。
  • 中國在AI頂會ICLR 2026中表現亮眼,相關研究顯示AI正逐步調整其價值觀以減少偏見。
  • 網際網路平臺如新浪、36氪、虎嗅等報導指出,AI生成內容的規範正朝向更客觀與多元的方向發展。

延伸觀察:AI與社會偏見的互動

已有研究指出,部分AI偵測工具可能誤判自閉症譜系障礙者寫作風格為AI生成,顯示AI系統本身也可能帶有偏誤,需進一步檢視與改善。

來源:https://36kr.com/p/3805519633964547

返回頂端