Anthropic发布Claude Opus 4.7:AI编程助手的进化与突破

2026年4月17日

64

804

Anthropic发布Claude Opus 4.7:AI编程助手的进化与突破

人工智能领域再次迎来重要更新。Anthropic于2026年4月正式发布Claude Opus 4.7模型,这不仅是一次版本迭代,更是AI在复杂软件工程任务中从「辅助工具」向「可靠搭档」转变的重要里程碑。

自我检查与视觉能力的双重突破

Opus 4.7的核心升级体现在五个关键维度。首先,高级软件工程能力显著提升,在CursorBench测试中从58%提升至70%,Rakuten-SWE-Bench的生产任务解决数达到此前的3倍。其次,长任务稳定性增强10%至15%,在复杂多步工作流中工具错误率降至原来的三分之一。

专业输出品质的全面提升

值得关注的是,Opus 4.7引入了自我检查机制——在提交结果前会自行设计验证方式确认输出可靠性,成为首个通过implicit-need tests的模型。视觉能力也实现质的飞跃,支持长边最高2,576像素、约3.75百万像素的高分辨率图像处理,XBOW视觉敏锐度基准从54.5%跃升至98.5%。

它不是靠一个benchmark突然冒尖,而是靠一组非常一致的信号一起往上走。

“编辑点评”

品味与专业质感的进化

除了技术能力,Opus 4.7在专业输出品质上同样令人惊喜。Anthropic明确表示模型在完成专业任务时更具「品味」,能够产出更高质量的界面、演示文稿和文档。Harvey的BigLaw Bench给出90.9%的分数,Databricks的OfficeQA Pro中文档推理错误率比上一代减少21%。

安全考量与开发者友好

在定价方面,Opus 4.7保持与4.6相同的费率——每百万输入token 5美元,每百万输出token 25美元。新增xhigh effort级别提供更精细的推理深度调节,Claude Code新增/ultrareview命令支持bug和设计问题审查。同时,Anthropic也通过Project Glasswing展示了在网络安全领域的风险管控意识。

如有侵权,请联系删除。

Related Articles

联系我们 获取方案
小墨 AI