AI代理人在職場上是否準備就緒?新測試標準提出懷疑
研究重點
最新研究檢視了領先的人工智慧模型在執行實際白領工作任務上的表現,這些任務來自顧問、投資銀行和法律領域。結果顯示,絕大多數模型都未能成功完成這些任務。
關鍵發現
- 在顧問、投資銀行和法律領域的實際工作任務中,AI模型表現不佳。
- 研究指出,目前的人工智慧模型在處理複雜、需要判斷與情境理解的白領工作時,仍存在重大困難。
- 僅少於25%的任務由AI模型正確完成,顯示其在真實情境下的應用能力仍極其有限。
相關討論
有觀點認為,若AI代理人在職場上已具備經濟可行性,那麼人類工作將不再必要,這點引發廣泛討論。
