OpenClaw代碼越改越崩？新研究EvoClaw揭示：Agents持續開發成功率僅13.37%

2026-03-25 23:35:52 / 1 閱讀所需時間

OpenClaw代碼越改越崩？新研究EvoClaw揭示：Agents持續開發成功率僅13.37%

研究背景與核心發現

新研究指出，AI代理（Agents）在持續開發過程中的成功率僅為13.37%，反映出當前AI編程技術存在嚴重「技術債」問題。該研究以OpenClaw為案例，揭示了在實際開發中，代碼頻繁修改反而導致系統不穩定，甚至「崩」的現象。

技術挑戰與現狀分析

綜合得分最高僅達38.03%（Claude Opus 4.6），顯示當前AI模型在複雜任務中的表現仍有限。
完整解決率最高為13.37%（Gemini 3 Pro），表明多數模型無法正確實現預期功能。
研究指出，AI代理在持續開發中面臨技能更新與代碼維護的難題，導致系統穩定性下降。

相關延伸與產業動態

該研究與金融級交易大賽、Ethereum及BNB Chain上的AI代理部署趨勢相關，顯示AI技術在實際場景中的應用仍處於探索階段。

此外，DeepSeek等大模型公司正積極招募Agent方向人才，反映產業對AI代理開發能力的高度關注。

未來展望

研究建議，主動重構（active refactoring）或成為突破當前AI編程技術債的關鍵路徑，未來需結合更穩健的架構設計與持續優化機制。

來源：https://eu.36kr.com/zh/p/3738221486096392