OpenClaw代碼越改越崩?新研究EvoClaw揭示:Agents持續開發成功率僅13.37%
研究背景與核心發現
新研究指出,AI代理(Agents)在持續開發過程中的成功率僅為13.37%,反映出當前AI編程技術存在嚴重「技術債」問題。該研究以OpenClaw為案例,揭示了在實際開發中,代碼頻繁修改反而導致系統不穩定,甚至「崩」的現象。
技術挑戰與現狀分析
- 綜合得分最高僅達38.03%(Claude Opus 4.6),顯示當前AI模型在複雜任務中的表現仍有限。
- 完整解決率最高為13.37%(Gemini 3 Pro),表明多數模型無法正確實現預期功能。
- 研究指出,AI代理在持續開發中面臨技能更新與代碼維護的難題,導致系統穩定性下降。
相關延伸與產業動態
該研究與金融級交易大賽、Ethereum及BNB Chain上的AI代理部署趨勢相關,顯示AI技術在實際場景中的應用仍處於探索階段。
此外,DeepSeek等大模型公司正積極招募Agent方向人才,反映產業對AI代理開發能力的高度關注。
未來展望
研究建議,主動重構(active refactoring)或成為突破當前AI編程技術債的關鍵路徑,未來需結合更穩健的架構設計與持續優化機制。
