先進AI模型處理長流程文件任務仍不可靠,內容遭改寫更難察覺
微軟研究指出AI模型在文件處理中會靜默損毀內容
微軟研究院發表研究指出,當前頂尖的大型人工智慧模型(LLMs)在處理文件時,會「靜默」地引入錯誤並改寫內容,導致高達四分之一的文件資訊遭損毀,且這些錯誤難以察覺。
長流程任務中AI表現更差
當AI代理工具被賦予長流程任務時,其不可靠性進一步加劇。研究發現,模型在長對話中產生的錯誤大幅飆升,顯示在持續性任務中,AI的穩定性與準確性嚴重不足。
專家建議主動管理AI工作流程
為改善AI在複雜任務中的表現,專家建議應透過切分任務、重置對話等方式,主動管理AI的工作情境,以減少錯誤產生與內容改寫的風險。
企業需重視工作流程設計
企業在導入AI時,應重視自身的工作流程設計,而非僅依賴模型的語氣或內部名詞模仿能力。AI雖能生成看似符合脈絡的內容,但未必掌握實際任務所需的系統資訊與版本控制。
