先進AI模型處理長流程文件任務仍不可靠，內容遭改寫更難察覺

微軟研究指出AI模型在文件處理中會靜默損毀內容

微軟研究院發表研究指出，當前頂尖的大型人工智慧模型（LLMs）在處理文件時，會「靜默」地引入錯誤並改寫內容，導致高達四分之一的文件資訊遭損毀，且這些錯誤難以察覺。

當AI代理工具被賦予長流程任務時，其不可靠性進一步加劇。研究發現，模型在長對話中產生的錯誤大幅飆升，顯示在持續性任務中，AI的穩定性與準確性嚴重不足。

為改善AI在複雜任務中的表現，專家建議應透過切分任務、重置對話等方式，主動管理AI的工作情境，以減少錯誤產生與內容改寫的風險。

企業在導入AI時，應重視自身的工作流程設計，而非僅依賴模型的語氣或內部名詞模仿能力。AI雖能生成看似符合脈絡的內容，但未必掌握實際任務所需的系統資訊與版本控制。