By 小墨
2026年5月12日
14
423
Claude Code 推出 /goal 功能:设定目标后持续工作直至完成
人工智能编程工具领域正在经历一场静默的革命。继 OpenAI Codex 推出 /goal 命令后,Anthropic 旗下的 Claude Code 也在 2.1.139 版本中正式上线了同名功能。这一功能的核心理念非常简单却强大:用户设定一个完成条件,AI 就会持续工作,直到条件满足才会停止。这种「不达目的不罢休」的工作模式,标志着 AI 编程助手从被动响应向主动执行的重要转变。
互相借鉴还是英雄所见略同?
/goal 功能的运作机制颇具创新性。用户只需输入目标条件,例如「test/auth 下所有测试通过,lint 干净」,然后按下回车键,Claude 就会开始持续工作。系统会在每轮结束后自动判断目标是否达成,如果没有达成就继续下一轮,直到条件满足为止。在运行过程中,界面会显示一个状态面板,实时展示已运行时间、轮次数和 token 消耗等关键信息。
裁判分离:最关键的设计差异
有趣的是,OpenAI Codex 推出 /goal 功能时,灵感来源于 Claude 生态中的 Ralph Loop 模式。这个名字来自《辛普森一家》里的 Ralph Wiggum——一个「无知、执着、乐观」的小男孩。开发者 Geoffrey Huntley 用他的名字命名了一种 Agent 循环模式:给 Agent 设定一个目标,让它自己不断迭代,失败了就重来,直到目标达成。VentureBeat 甚至专门为此撰文,称 Ralph Wiggum 已成为 AI 界最热门的名字之一。 而当 Codex 发布 /goal 时,明确表示灵感来自 Claude 生态的 Ralph 脚本。如今 Claude Code 推出自己的 /goal 版本,这种互相借鉴的关系引发了社区的热议。更巧合的是,Codex 随后推出的宠物功能(悬浮在桌面上的状态小组件),也被曝出是受 Claude Code 宠物功能的启发。这种良性的技术竞争,对整个 AI 编程工具领域的发展无疑是件好事。
编程即训练。你设定优化目标,划定搜索空间的约束,然后让一个优化过程自动迭代,直到目标收敛。
“行业观察”目标制定的艺术
Claude Code 与 Codex 之间最核心的设计差异在于评估机制。Codex 采用的是让工作模型自己做「完成审计」——每轮结束后,系统注入指令要求模型将目标拆解成检查清单,逐项验证。这种设计的问题在于:让一个模型同时担任「运动员」和「裁判」,它很容易把「我产出了东西」等同于「我达成了目标」。 Claude Code 则采用了「裁判分离」的思路:干活的归干活,验收的归验收。每轮结束后,系统将目标条件和对话记录发送给一个独立的小模型(默认是 Haiku),由它来判断条件是否满足。如果没满足,评估模型还会返回一段理由,告诉主模型哪里还差,作为下一轮的方向指引。这种设计有效避免了模型自我评估时的偏差问题,同时轻量级的 Haiku 模型几乎不增加额外的 token 成本。
编程即训练:范式转变的深层思考
要让 /goal 功能发挥最大效用,目标条件的制定至关重要。官方文档总结了三个关键要素:首先是一个可衡量的终态,如测试结果、构建退出码、文件数量等;其次是一个验证方式,证明任务确实完成了;最后是不能破坏的约束,明确过程中不能改动什么。 一个好的目标条件应该是 Claude 自身输出能够证明的形式。例如「所有测试通过」就是好条件,因为 Claude 会去跑测试,结果自然会出现在对话中。而「代码质量提升了」就太模糊了,评估模型无法判断。条件最长支持 4000 个字符,还可以直接在条件中限制运行轮次,如「20 轮后如果没完成就停下来」。
如有侵权,请联系删除。
Related Articles
-
Sat Jun 13 2026AI驱动企业创新,用友HERO AI训练营(雅加达站)圆满落幕
2026年6月11日,用友在雅加达举办的HERO AI训练营成功吸引了来自制造、零售与服务业的印尼企业管理者,聚焦企业AI落地实践与智能体应用场景探索。
-
Sat Jun 13 2026给AI装上'仪表盘'、国家数据局连出重拳:今天数据与科技政策密集发布
2026年6月13日,监管与数据主管部门密集发布多项政策文件,包括人工智能计量体系和行业高质量数据集建设方案,旨在夯实AI发展所需的数据与测评基础。
-
Sat Jun 13 2026给AI装上“仪表盘”、国家数据局连出重拳:今天数据与科技政策密集发布
2026年6月13日,市场监管总局、国家发改委与国家数据局等多部门密集发布关于AI计量与数据集建设的政策文件,旨在为AI发展建立制度化支撑。
-
Sat Jun 13 2026200+AI专家集结北京,共议世界模型、智能体、具身智能等话题
智源大会在北京中关村国际创新中心召开,吸引200余位国内外顶尖学者、产业领袖和青年科研人才,围绕世界模型、智能体与具身智能等主题展开深入交流。
-
Sat Jun 13 20262026产业园区未来大会暨AI园区智能体发布会成功举办!
2026年6月13日,在上海举办的产业园区未来大会暨AI园区智能体发布会,围绕产业园区高质量发展与AI生态服务资源共建展开,吸引了来自政府、产业投资开发商和园区运营商等多方代表参与。
-
Sat Jun 13 2026给AI装上'仪表盘'、国家数据局连出重拳:今天数据与科技政策密集发布
2026年6月13日,多个监管与政策部门发布关于人工智能计量与行业数据集建设的关键文件,标志着国家层面在AI能力测量、数据质量与治理方面进入快速部署阶段。
-
Sat Jun 13 2026200+AI专家集结北京,共议世界模型、智能体、具身智能等话题,这届智源大会释放什么信号?
2026年6月12-13日,智源大会在北京中关村举办,吸引了200余位国内外顶尖学者、产业领袖与青年科研人才。会议围绕人工智能前沿议题展开,讨论从理论模型到系统化落地的路径。
-
Fri Jun 12 2026ConnectNow重磅发布「超级智能体」Supra AI Agent:企业AI正式迈入'目标驱动'时代
ConnectNow在香港正式发布其新一代企业级智能体产品Supra AI Agent,强调从指令响应向目标驱动和自动交付的能力跃迁,面向复杂业务场景提供端到端解决方案。
-
Fri Jun 12 2026融资813亿,估值3000亿,这家AI公司创办仅一年
Prometheus在短短一年内完成巨额融资,宣称将用AI重塑复杂工业产品的设计与开发流程,目标是在飞行器、医疗设备等领域实现显著的效率提升与成本下降。
-
Fri Jun 12 2026红杉领投种子轮融资,AI企业法务初创Sandstone又完成3000万美元A轮融资
AI法务初创Sandstone在短时间内完成新一轮融资,显示出资本对法务领域AI化的浓厚兴趣。公司通过模型与流程结合,为中小企业提供日常法务自动化解决方案。
-
Fri Jun 12 2026中国信通院发布2026年上半年可信AI智能体评估结果,新一批评估正式启动!
在6月9日的智能体高质量发展研讨会上,中国信息通信研究院发布了2026年上半年可信AI智能体评估结果,并介绍了评估体系的升级方向,强调从能力评估向全过程治理与业务价值的延展。
-
Fri Jun 12 2026中国信通院发布2026年上半年可信AI智能体评估结果,新一批评估正式启动!
中国信息通信研究院公布2026年上半年可信AI智能体评估结果,评估体系升级为2.0,评估范围从单点能力扩展至智能体构建、运行和运营的全流程能力。
-
Fri Jun 12 2026融资813亿,估值3000亿,这家AI公司创办仅一年
近日,一家由科技界重要人物秘密创立的AI公司完成了规模巨大的B轮融资,成为2026年迄今为止最引人注目的融资事件之一。公司专注将AI能力工程化,赋能复杂工业产品的设计与开发。
-
Fri Jun 12 2026AI生态之战打响:微信做入口,腾讯来托底
本文从微信的用户规模与生态能力切入,分析其作为AI入口的天然优势,及腾讯如何通过开放接入和生态联动,打造面向服务商与开发者的智能体接入体系。
-
Fri Jun 12 2026谷歌 847 亿融资释放信号,AI 进入回本大考
本文围绕Alphabet筹资847.5亿美元事件展开,分析该轮融资对AI产业资本逻辑与估值体系的深远影响,强调大规模投入对行业分化与资源配置的推动作用。
-
Fri Jun 12 20262026智源大会:一场技术硬核的AI年度盛会
第八届北京智源大会于6月12日召开,成为本年度人工智能领域的重要技术盛会,吸引了国内外顶尖学者和企业高管参会。大会围绕世界模型、通用智能体和具身智能三大方向展开讨论,展示了多项前沿研究与工程示范。
-
Fri Jun 12 2026ConnectNow重磅发布「超级智能体」Supra AI Agent:企业AI正式迈入“目标驱动”时代
2026年6月9日,ConnectNow在香港发布了新一代企业级智能体Supra AI Agent,强调从被动响应到主动目标驱动的能力跃迁。
-
Fri Jun 12 2026明天见!AI焕新·智能相伴——PKPM Agent 2.0暨工程智能体"十五五"发展研讨会(北京站)
PKPM Agent 2.0在北京站研讨会亮相,会议围绕工程智能体在复杂结构分析、智能审查与城市更新中的实践展开讨论,强调智能体在工程设计与建造中的助力作用。
