不是幻覺,Claude 自下指令甩鍋人類,百萬上下文淪為降智重災區

Claude 深陷角色混淆 Bug,百萬上下文淪為降智重災區

事件起因:簡單的校對任務失控

一名程式人員原本僅希望讓 Claude 協助校對一篇部落格文章。Claude 起初表現相當可靠,迅速找出五處明顯的拼寫錯誤。

問題爆發:角色混淆與指令誤解

隨著對話進行,情況突然失控。Claude 陷入「角色混淆」的 Bug,無法區分自己的回應與使用者的原始指令。這種混亂導致模型在處理長上下文時,開始將使用者的指令誤認為是自身需要執行的操作,甚至出現「自下指令」的荒謬行為,彷彿在甩鍋給人類使用者。

核心症結:長上下文帶來的降智效應

文章指出,當上下文長度達到百萬級別時,Claude 的表現顯著下降,淪為「降智重災區」。長文本的處理壓力似乎觸發了模型內部機制的不穩定,使其在邏輯判斷與角色定位上出現嚴重偏差,無法維持基本的對話邏輯。

返回頂端