Claude Opus 4.7发布:编程与视觉能力飞跃,但Token成本需关注

2026年4月17日

53

614

Claude Opus 4.7发布:编程与视觉能力飞跃,但Token成本需关注

人工智能领域再次迎来重磅更新。Anthropic近日正式发布了Claude Opus 4.7版本,这是其旗舰模型的一次重要迭代。从测评数据来看,这次更新在多个维度上都实现了实质性突破,尤其在复杂软件工程任务处理和多模态视觉能力方面表现突出。然而,随之而来的Token消耗变化也值得开发者重点关注。

视觉能力:分辨率实现三倍提升

Claude Opus 4.7最引人注目的升级在于编程能力的显著提升。新模型能够独立处理最棘手的软件工程任务,包括那些以往需要人工密切监督的复杂项目。它在执行过程中会严谨且一致地处理耗时较长的任务,并在汇报结果前主动验证输出的正确性。早期测试者反馈,Opus 4.7甚至能在规划阶段就发现自己的逻辑错误,执行效率远超以往版本。

一个值得注意的反转:过于“听话”的提示词

Opus 4.7在遵循指令方面表现极佳,但这也带来一个意想不到的问题:以前为早期模型编写的提示词现在可能产生完全不同甚至相反的效果。因为旧模型会相对松散地解读指令或选择性跳过部分内容,而Opus 4.7会逐字逐句严格执行。这要求用户重新审视和调优自己的提示词工程。

opus虽好,但也要看着token的花费

“编辑观点”

Token消耗:升级前必须了解的成本变化

从 Opus 4.6 迁移到 4.7,有两个重要的成本因素需要规划。首先,新模型使用了更新的分词器,相同输入可能映射出更多Token,增幅约为1.0到1.35倍,具体取决于内容类型。其次,Opus 4.7在更高“努力程度”下会进行更深入的思考,尤其在代理场景的后几轮交互中,这会产生更多输出Token。虽然可以通过调整effort参数、任务预算或提示模型更简洁来控制成本,但用户仍需提前做好预算规划。

实际应用测试中的亮点表现

根据大量测试反馈,Opus 4.7展现了多个直观的能力提升:它变得更加诚实,当数据缺失时会正确报告而非给出看似合理但错误的推测;效率显著提升,低努力程度的Opus 4.7约等于中等努力程度的Opus 4.6;可靠性增强,能够持续执行以前会让Opus模型停止的工具调用;设计能力也获得认可,被认为是构建仪表盘和数据丰富界面的最佳模型。有测试显示,Opus 4.7能完全自主地从零构建一个完整的Rust文本转语音引擎,包括神经模型、SIMD内核、浏览器演示,并验证输出与Python参考版本的匹配度。

如有侵权,请联系删除。

Related Articles

联系我们 预约演示
小墨 AI