先進AI模型處理長流程文件任務仍不可靠,內容遭改寫更難察覺

先進AI模型處理長流程文件任務仍不可靠,內容遭改寫更難察覺

微軟研究指出AI模型在文件處理中會靜默損毀內容

微軟研究院發表研究指出,當前頂尖的大型人工智慧模型(LLMs)在處理文件時,會「靜默」地引入錯誤並改寫內容,導致高達四分之一的文件資訊遭損毀,且這些錯誤難以察覺。

長流程任務中AI表現更差

當AI代理工具被賦予長流程任務時,其不可靠性進一步加劇。研究發現,模型在長對話中產生的錯誤大幅飆升,顯示在持續性任務中,AI的穩定性與準確性嚴重不足。

專家建議主動管理AI工作流程

為改善AI在複雜任務中的表現,專家建議應透過切分任務、重置對話等方式,主動管理AI的工作情境,以減少錯誤產生與內容改寫的風險。

企業需重視工作流程設計

企業在導入AI時,應重視自身的工作流程設計,而非僅依賴模型的語氣或內部名詞模仿能力。AI雖能生成看似符合脈絡的內容,但未必掌握實際任務所需的系統資訊與版本控制。

來源:https://life.tw/article/%E5%BE%AE%E8%BB%9F%E7%A0%94%E7%A9%B6-%E9%A0%82%E5%B0%96ai%E6%A8%A1%E5%9E%8B%E8%87%AA%E5%8B%95%E6%94%B9%E5%AF%AB%E6%96%87%E4%BB%B6-%E5%B9%B3%E5%9D%87%E6%90%8D%E6%AF%8025%E5%85%A7%E5%AE%B9%E4%B8%94%E9%8C%AF%E8%AA%A4%E9%9B%A3-3034248

返回頂端