By 小墨
2026年4月17日
53
614
Claude Opus 4.7发布:编程与视觉能力飞跃,但Token成本需关注
人工智能领域再次迎来重磅更新。Anthropic近日正式发布了Claude Opus 4.7版本,这是其旗舰模型的一次重要迭代。从测评数据来看,这次更新在多个维度上都实现了实质性突破,尤其在复杂软件工程任务处理和多模态视觉能力方面表现突出。然而,随之而来的Token消耗变化也值得开发者重点关注。
视觉能力:分辨率实现三倍提升
Claude Opus 4.7最引人注目的升级在于编程能力的显著提升。新模型能够独立处理最棘手的软件工程任务,包括那些以往需要人工密切监督的复杂项目。它在执行过程中会严谨且一致地处理耗时较长的任务,并在汇报结果前主动验证输出的正确性。早期测试者反馈,Opus 4.7甚至能在规划阶段就发现自己的逻辑错误,执行效率远超以往版本。
一个值得注意的反转:过于“听话”的提示词
Opus 4.7在遵循指令方面表现极佳,但这也带来一个意想不到的问题:以前为早期模型编写的提示词现在可能产生完全不同甚至相反的效果。因为旧模型会相对松散地解读指令或选择性跳过部分内容,而Opus 4.7会逐字逐句严格执行。这要求用户重新审视和调优自己的提示词工程。
opus虽好,但也要看着token的花费
“编辑观点”Token消耗:升级前必须了解的成本变化
从 Opus 4.6 迁移到 4.7,有两个重要的成本因素需要规划。首先,新模型使用了更新的分词器,相同输入可能映射出更多Token,增幅约为1.0到1.35倍,具体取决于内容类型。其次,Opus 4.7在更高“努力程度”下会进行更深入的思考,尤其在代理场景的后几轮交互中,这会产生更多输出Token。虽然可以通过调整effort参数、任务预算或提示模型更简洁来控制成本,但用户仍需提前做好预算规划。
实际应用测试中的亮点表现
根据大量测试反馈,Opus 4.7展现了多个直观的能力提升:它变得更加诚实,当数据缺失时会正确报告而非给出看似合理但错误的推测;效率显著提升,低努力程度的Opus 4.7约等于中等努力程度的Opus 4.6;可靠性增强,能够持续执行以前会让Opus模型停止的工具调用;设计能力也获得认可,被认为是构建仪表盘和数据丰富界面的最佳模型。有测试显示,Opus 4.7能完全自主地从零构建一个完整的Rust文本转语音引擎,包括神经模型、SIMD内核、浏览器演示,并验证输出与Python参考版本的匹配度。
如有侵权,请联系删除。
Related Articles
-
Sat Apr 18 2026《AI时代的商业进化蓝图(2026)》白皮书发布:企业不再为AI本身买单
中欧国际工商学院与特赞科技联合发布《AI时代的商业进化蓝图(2026)》,为企业从单点AI应用向系统级智能体驱动的经营模式转型提供路线图。
-
Sat Apr 18 20262026 AI融资大爆发:这30个APP正在被资本疯抢!
截至2026年4月中旬,AI应用领域进入资本密集投入阶段,多个以终端体验和行业落地为核心的项目获得大额融资。
-
Sat Apr 18 2026智谱AutoClaw上线「自进化」机制,Claude Opus 4.7可自我验证结果,OpenAI切入生命科学专用AI赛道
2026年4月中旬,多家AI公司纷纷发布关键产品与能力升级,推动AI系统向自验、可修复与行业垂直化方向演进。
-
Sat Apr 18 20262026 AI融资大爆发:这30个APP正在被资本疯抢!
本文系统整理了2026年1-4月间AI应用领域的融资活动,挑选出30个代表性APP或产品,分析其产品形态、融资轮次与投资方逻辑。
-
Sat Apr 18 2026DeepSeek估值百亿美金首次融资,AI根本是人才之争
本文基于独家信息,报告DeepSeek正在寻求首轮外部融资,目标估值达到百亿美元级别,同时记录了过去两年内多位核心技术人员的去向与影响。
-
Sat Apr 18 2026一天吃透一个行业06:AI应用与智能体——2026,AI从'聊天'到'干活'的元年(附:股票名单)
2026年被视为AI智能体(Agent)从概念走向大规模落地的关键一年。本文从技术、产业与资本三条主线出发,系统梳理推动智能体爆发的四大条件,并拆解产业链各层的核心参与者与机会。
