2026年3月31日

980

Harness不是加一行规则那么简单——深度解析三家科技巨头的AI行为工程实践

2026年，Harness（缰绳工程）已成为AI开发领域的热门话题。各种社群中充斥着“缰绳工程”、“马鞍比马重要”等概念，似乎只要在配置文件中加一行“不要做XX”的规则，就掌握了Harness的精髓。但当我深入阅读Mitchell Hashimoto、OpenAI和Anthropic的原文后，发现一个关键问题：大多数文章都在解释Harness是什么，却很少有人回答一个更实际的问题——读完之后，我到底该做什么？

第一步：编写行为规则

Harness不是一个东西，是一条路。这条路分为三步，而大多数人只走了第一步。

第二步：打造自动化工具

Terraform和Vagrant的创始人Mitchell Hashimoto今年2月发表文章，讲述自己从AI怀疑者变成“缰绳工程师”的过程。他给Harness Engineering下了一个精辟的定义：“Anytime you find an Agent makes a mistake, you take the time to engineer a solution such that the agent never makes that mistake again.”（每次AI犯错，你都花时间建一个机制，让它永远不再犯同类错误。） Harness的第一种形态是文字规则：写进AGENTS.md或CLAUDE.md的行为约束。以他开源项目Ghostty为例——那个文件里的每一行，都对应着一次AI犯过的错。AI编造了一个你没经历过的故事？加一条“禁止编造困境”。AI总是不该改的地方改代码？加一条“只改指定文件”。这就是最简单的起步方式。但如果停在这一步，会遇到一个明显的天花板：规则是被动的——AI读到了才生效，读不到就没用。

Give Codex a map, not a 1,000-page instruction manual.

“OpenAI团队”

第三步：分离评估

Harness的第二种形态是自动化工具——脚本、linter、测试。换句话说，不是靠“跟AI说一声”来约束它，而是造一个工具让机器自动检查。OpenAI的团队把这件事做到了极致。他们做了一个激进的实验：3个工程师，5个月，整个项目不允许任何人手写代码。结果合并了1500个PR，产出约100万行代码，做出了一个有真实用户在用的产品。但最值得关注的不只是结果，而是过程。工程师Ryan Lopopolo在文章里写道：“Early progress was slower than we expected, not because Codex was incapable, but because the environment was underspecified.”（早期进展比预期慢，不是因为AI不行，而是因为环境缺乏定义——AI缺少完成任务所需的工具和结构。）他们做了什么？给AI造工具。让AI能启动应用、截图、驱动浏览器来验证自己的工作；让AI能查询日志和监控指标来判断性能是否达标；让AI有一整套本地可观测性栈来调试问题。工程师的工作，从“写代码”变成了“让AI能验证自己的代

Anthropic的工程师Prithvi Rajasekaran发现了一个底层问题：让AI评估自己的产出，它永远会给自己打高分。“Tuning a standalone evaluator to be skeptical turns out to be far more tractable than making a generator critical of its own work.”（让一个独立的评估器变得苛刻，远比让生成器自我批评容易得多。）这是系统性的偏差。即使在有客观标准的任务上（比如代码能不能跑通），AI自我评估时依然倾向于给自己开绿灯。 Anthropic的解法借鉴了GAN（生成对抗网络）的思路：把生成和评估分开。一个AI负责做事（generator），另一个独立的AI负责打分（evaluator）。evaluator用Playwright实际操作产品——点击、截图、检查功能——然后给出评分和具体的改进意见。generator根据这些反馈迭代。结果：同样的任务，加上evaluator之后，产出质量有明显提升。一个4分钟生成的网页和一个经过15轮评估迭代的网

如有侵权，请联系删除。

Harness工程提示词工程 AI行为规范 Agent开发积墨AI AI智能体 AI智能体平台私有化AI智能体平台企业级AI智能体

Share This Post

Harness不是加一行规则那么简单——深度解析三家科技巨头的AI行为工程实践

第一步：编写行为规则

第二步：打造自动化工具

第三步：分离评估

Popular Articles

企业级AI智能体如何突破效率孤岛，实现价值共振？

阿里通义Qwen模组：一周三次开源造势

积墨AI 7月更新日志

Related Articles

线上】AI基础设施技术测试周

《AI智能体（Agent）赋能制造管理提效》

Figure AI 实现每90分钟下线一台人形机器人

GEO智领增长，AI Agent重构全域引擎——AI创新营销工作坊圆满举办

影目科技 印传学：AI+AR智能眼镜 从破圈到发展趋势预判

Q1全球VC 3000亿美元AI占八成创纪录；Sarvam AI 3亿美元成印度最大AI融资；特朗普对药品加征100%关税

Q1全球VC 3000亿美元AI占八成创纪录；Sarvam AI 3亿美元成印度最大AI融资

从OpenClaw看透AI Agent产业链

AI-GEO+OPC双赛道红利，4月11日深圳开启

月度路演 2026年4月 “AI x 先进制造”主题，项目&观众报名开启

小红书、京东、蚂蚁、平安等7位专家复盘AI落地实战，2026奇点智能技术大会「AI+行业落地实践」专题揭晓

解锁AI营销新范式，共赴2026首届AI+营销数字转型峰会

中国AI，最新趋势来了！

4亿美元收购，万亿独角兽杀入AI制药；瑞盛生物完成收购常州天宁龙洋金铂利口腔门诊部51%股权

Helidon 引入 Agent 能力，Java 框架开始内建 AI 编排

【中泰传媒】康雅雯：AI技术迭代与商业化加速，国产大模型全球化竞争力凸显

从豆包AI手机到学而思'小精龙'：AI Agent正在拆开教育的'黑箱'

AI算力'命脉级'硬件，OCS行业爆发前夜，5家A股公司抢先布局

三天实战手把手 AI智能体实操特训

围观巅峰对决！首届“AI智能体+”大赛决赛，邀你共同见证！

Agentic AI Summit深圳大会启动，别只谈Agent理想，来深圳解决Agent落地后的'脏活累活'

政策落地：AI+电商10家核心概念股盘点

从豆包AI手机到学而思“小精龙”：AI Agent正在拆开教育的“黑箱”

全球首个射频大模型 RF‑GPT 发布！AI 终于看懂无线信号，6G 认知革命来了

探索具身智能前沿：信息与智能工程学院专业教师为学生深度解读Agent AI

388万元，AI智能体大单：火山引擎中标

“2026 FORCE LINK AI 创新巡展・武汉站”成功举办！

刷爆全网！2026最火科技：AI Agent不再是概念，人人都能拥有专属'数字员工'

从聊天到行动：2026年AI Agent如何重塑人机协作

【投融资】2亿视频、2840万美元收入，AI音视频应用Captions更名Mirage，GeneralCatalyst注资7500万美元

普华永道：金融机构AI投资回报已达10%-15%，大规模推广AI仍有困难

从聊天到行动：2026年AI Agent如何重塑人机协作

41岁程序员靠AI年入4亿美元：普通人如何抓住这波AI红利？

刷爆全网！2026最火科技：AI Agent不再是概念，人人都能拥有专属'数字员工'

“AI+制造”的范式革命

探索具身智能前沿：信息与智能工程学院专业教师为学生深度解读Agent AI

一夜变天，Anthropic正式封杀OpenClaw！全球开发者24小时血崩

灵伴科技CEO祝铭明：AI 眼镜重构产业生态 余江应以认知更新拥抱智能未来

57k Star霸榜GitHub！字节这款超级智能体，凭何让全球AI圈真香？

灵伴科技CEO祝铭明：AI 眼镜重构产业生态 余江应以认知更新拥抱智能未来

博联率先接入 QClaw，以微信开启全屋智能 AI Agent 新时代

博联率先接入 QClaw，以微信开启全屋智能 AI Agent 新时代

AI手术机器人企业磅策医疗完成亿元B轮融资，构筑AI消费医疗新生态

北京大学《OpenClaw001：龙虾使用入门》开启个人 AI Agent 平民化时代

甲子光年：AI原生组织——OpenClaw推动组织形态重塑 2026

南京分院政企数智项目组 AI 系列研讨（四）AI Agent 技术体系深度解析

智能体全面开花，产业链做好落地准备了吗？AI Agent专场沙龙全链路洞察清智资本、华为、MiniMax……

多模态开放模型、AI 驱动内核优化与 Agent 原生支付（2026.04.03）

主权 AI 基建、Agent 基础设施与边缘优先（2026.04.02）

共拓百亿级金融通用智能体市场！阿里云联合百家伙伴吹响冲锋号

字节跳动披露豆包大模型日均 Token 突破 120 万亿/OpenAI 二级市场 6 亿美元股份无人接盘

【企业动态】深擎科技亮相阿里云金融 AI 联盟大会，以证券垂类 AI 能力共拓百亿智能体市场

NexusGen完成新一轮数千万级别融资 ，让AI回归个人掌控

字节跳动披露豆包大模型日均 Token 突破 120 万亿/OpenAI 二级市场 6 亿美元股份无人接盘

合合信息亮相2026金融AI联盟大会，携手阿里云共同启动'超级智能体计划'

3月软件大厂激战AI智能体，转型阵痛与高增长并存

智能体全面开花，产业链做好落地准备了吗？AI Agent专场沙龙全链路洞察清智资本、华为、MiniMax……

【报告】OpenClaw专题二：OpenClaw 深度调研报告-从对话到执行的AI智能体革命（附PDF下载）

【企业动态】深擎科技亮相阿里云金融 AI 联盟大会，以证券垂类 AI 能力共拓百亿智能体市场

他用2万美元和十几个AI工具，做出一家年入18亿美元的公司

171 万、北京地铁《基于 AI 大模型的网络安全态势感知智能体》大单

企业级AI下半场没有捷径：联想给出破局之道

主权AI基建、Agent基础设施与边缘优先（2026.04.02）

主权 AI 基建、Agent 基础设施与边缘优先（2026.04.02）

从"物质资产"到"AI资产"，远景AI储能新品矩阵亮相ESIE 2026

未来已来，未来你来！OPC时代AI智能体部署与实战高级研修班开启报名

从'物质资产'到'AI资产'，远景AI储能新品矩阵亮相ESIE 2026

智能体全面开花，产业链做好落地准备了吗？AI Agent专场沙龙全链路洞察清智资本、华为、MiniMax……

南京分院政企数智项目组 AI Agent 技术体系深度解析

TE Connectivity调研：AI步入成熟期，投资回报率成为首要目标

ICML26 第三届 AI for Math Workshop 征稿启动：走向自进化科学智能体

影目科技印传学：AI+AR智能眼镜从破圈到发展趋势预判

灵伴科技CEO祝铭明：AI 眼镜重构产业生态余江应以认知更新拥抱智能未来

灵伴科技CEO祝铭明：AI 眼镜重构产业生态余江应以认知更新拥抱智能未来

NexusGen完成新一轮数千万级别融资，让AI回归个人掌控

AI Agent 落地实务全拆解解锁商科智能新玩法

五方六力赋能京苏双向奔赴