OpenClaw代碼越改越崩?新研究EvoClaw揭示:Agents持續開發成功率僅13.37%

OpenClaw代碼越改越崩?新研究EvoClaw揭示:Agents持續開發成功率僅13.37%

研究背景與核心發現

新研究指出,AI代理(Agents)在持續開發過程中的成功率僅為13.37%,反映出當前AI編程技術存在嚴重「技術債」問題。該研究以OpenClaw為案例,揭示了在實際開發中,代碼頻繁修改反而導致系統不穩定,甚至「崩」的現象。

技術挑戰與現狀分析

  • 綜合得分最高僅達38.03%(Claude Opus 4.6),顯示當前AI模型在複雜任務中的表現仍有限。
  • 完整解決率最高為13.37%(Gemini 3 Pro),表明多數模型無法正確實現預期功能。
  • 研究指出,AI代理在持續開發中面臨技能更新與代碼維護的難題,導致系統穩定性下降。

相關延伸與產業動態

該研究與金融級交易大賽、Ethereum及BNB Chain上的AI代理部署趨勢相關,顯示AI技術在實際場景中的應用仍處於探索階段。

此外,DeepSeek等大模型公司正積極招募Agent方向人才,反映產業對AI代理開發能力的高度關注。

未來展望

研究建議,主動重構(active refactoring)或成為突破當前AI編程技術債的關鍵路徑,未來需結合更穩健的架構設計與持續優化機制。

來源:https://eu.36kr.com/zh/p/3738221486096392

返回頂端