By 积墨AI

2026年3月25日

374

OpenClaw代码越改越崩？新研究EvoClaw揭示：Agents持续开发成功率仅13.37%

EvoClaw 由多所高校联合提出，通过重构开源项目的真实演进历史，评估智能体在连续软件开发任务中的表现，得出令人警醒的结论。

从单点修复到持续演进：测试协议的复杂化

研究表明，离开受控的单次修复任务，智能体在面对依赖关系复杂的里程碑式演进时，成功率大幅下降，暴露出规划与长期一致性的问题。

13.37% 的现实意义

仅 13.37% 的成功率说明当前方法在长期任务保持正确性、兼容性与演进策略方面仍不足，提示需要更强的记忆、回溯与集成测试能力。

一旦进入持续演进的真实开发场景，智能体的表现就会出现断崖式下跌。

“小墨”

对工具与研究路径的启示

研究建议将更多注意力放在多步推理、持续集成与代理间协作机制上，以提升智能体在真实工程演进中的可靠性。

未来工作方向

包括更好的任务分层、长期状态管理与基于真实演进历史的训练与评估范式，以缩小当前能力差距，实现更可信的持续开发。

如有侵权，请联系删除。

EvoClaw 持续开发评估基准 AI 编程局限开源项目里程碑任务断崖式下跌软件演进积墨AI AI智能体 AI智能体平台私有化AI智能体平台企业级AI智能体

Share This Post

OpenClaw代码越改越崩？新研究EvoClaw揭示：Agents持续开发成功率仅13.37%

从单点修复到持续演进：测试协议的复杂化

13.37% 的现实意义

对工具与研究路径的启示

未来工作方向

Popular Articles

企业级AI智能体如何突破效率孤岛，实现价值共振？

阿里通义Qwen模组：一周三次开源造势

积墨AI 7月更新日志

Related Articles

【AI】Agent落地、千亿募资与算力军备：AI正在经历一场'去泡沫化'战争

AI+介入机器人：'智能协同'定义介入诊疗新趋势

反超OpenAI！Anthropic登顶全球最贵AI公司

从代码生成到智能体协同：源启双引擎重构企业AI落地新范式

智王AI量化智能体，五月封神：AGI在资本市场的初代力量

博泰车联：与英伟达举行战略合作签约仪式，双方围绕车载AI、自动驾驶、下一代计算平台及光通信等进行探讨

2026新政解读:智能体与AI终端的'双向奔赴',AIoT产业迎来三大价值重构

芮勇主讲：AI智能体的最新进展、挑战和机会

2026全球AI算力报告及算力产业十大趋势重磅发布

AI Open Day兰州龙虾大会圆满举办，共绘西北数字经济新蓝图

谷歌AI垂直整合战略，全世界都在静静观察

2026全球AI与Agent的演进与落地

Agent爆发周期，思格新能源画出了'AI+光储'时代的新坐标

AI编程Cognition融资超10亿美元，估值260亿美元，ARR 4.92亿美元

AI推理服务商Fireworks AI拟定新一轮融资，估值150亿美元

软银主导国产AI联盟又吸引15家公司投资

别在CVPR独自社恐了！来丹佛AI Talent Meetup，只聊你听得懂的技术与理想

临床试验革命！神经AI平台横空出世，FDA实时审查新政迎来首个落地者

OpenClaw代码越改越崩？新研究EvoClaw揭示：Agents持续开发成功率仅13.37%

从单点修复到持续演进：测试协议的复杂化

13.37% 的现实意义

对工具与研究路径的启示

未来工作方向

Popular Articles

企业级AI智能体如何突破效率孤岛，实现价值共振？

阿里通义Qwen模组：一周三次开源造势

积墨AI 7月更新日志

Related Articles

【AI】Agent落地、千亿募资与算力军备：AI正在经历一场'去泡沫化'战争

AI+介入机器人：'智能协同'定义介入诊疗新趋势

反超OpenAI！Anthropic登顶全球最贵AI公司

从代码生成到智能体协同：源启双引擎重构企业AI落地新范式

智王AI量化智能体，五月封神 ：AGI在资本市场的初代力量

博泰车联：与英伟达举行战略合作签约仪式，双方围绕车载AI、自动驾驶、下一代计算平台及光通信等进行探讨

2026新政解读:智能体与AI终端的'双向奔赴',AIoT产业迎来三大价值重构

芮勇主讲：AI智能体的最新进展、挑战和机会

2026全球AI算力报告及算力产业十大趋势重磅发布

AI Open Day兰州龙虾大会圆满举办，共绘西北数字经济新蓝图

谷歌AI垂直整合战略，全世界都在静静观察

2026全球AI与Agent的演进与落地

Agent爆发周期，思格新能源画出了'AI+光储'时代的新坐标

AI编程Cognition融资超10亿美元，估值260亿美元，ARR 4.92亿美元

AI推理服务商Fireworks AI拟定新一轮融资，估值150亿美元

软银主导国产AI联盟又吸引15家公司投资

别在CVPR独自社恐了！来丹佛AI Talent Meetup，只聊你听得懂的技术与理想

临床试验革命！神经AI平台横空出世，FDA实时审查新政迎来首个落地者

智王AI量化智能体，五月封神：AGI在资本市场的初代力量