2026年3月31日

994

Harness Engineering崛起，规范驱动开发还有价值吗？

近期，一个名为「Harness Engineering」的概念在AI工程领域引起了广泛关注。HashiCorp联合创始人Mitchell Hashimoto和OpenAI工程团队先后发文，阐述了一套让AI Agent可靠工作的工程方法论。与此同时，规范驱动开发（SDD）作为一种通过结构化规范指导AI编程的实践，也正在被越来越多的团队采纳。这不禁引发了一个关键问题：当Harness体系不断完善时，投入精力构建规范体系是否仍然有意义？

Harness到底是什么

在回答这个问题之前，需要先厘清Harness的含义。Mitchell Hashimoto将Harness定义为：当发现Agent犯错误时，花时间工程化一个解决方案，确保Agent不再重犯同类错误。具体做法包括记录Agent的异常行为模式（如Ghostty项目的AGENTS.md），以及编写专用工具脚本让Agent能够自我验证。OpenAI则从团队系统的层面描述了更大规模的实践——5个月内用约100万行代码构建完整系统，全部由Agent生成代码，人类工程师的职责转向定义产品规格、设计约束和搭建反馈系统等支撑性工作。两个视角指向同一个核心：Harness是让Agent可靠工作的系统环境，而不仅仅是模型本身。

工程纪律的转移

OpenAI在其官方文章中指出：「构建软件仍然需要纪律，但纪律更多地体现在支撑结构上，而不是代码上。」这一论断揭示了一个重要趋势：工程纪律的重心正在从「如何写好代码」转移到「如何构建支撑Agent工作的系统体系」——包括结构化的文档、明确的约束规则、完善的反馈回路等。从代码驱动转向环境设计，是这场变革的本质特征。OpenAI还特别强调了一个关键发现：从Agent的视角来看，它在运行时无法访问的内容都等同于「不存在」——存储在文档、聊天记录或人类头脑中的知识无法被系统触及，只有仓库本地版本化的工件才是Agent所能看到的全部。

引擎越强，导航越重要。

“53AI”

🦞

JimoClaw — 桌面 AI Agent 工作台

让 AI 处理本地资料、操控浏览器，最终交付可直接使用的文档、表格与 PPT，而不只是一段回答。

下载桌面版

Spec在Harness中的三个核心角色

一旦理解了这个背景，Spec在Harness中的角色就变得清晰。首先，Spec是Agent推理的「地图」而非「百科全书」。OpenAI的实践原则是「给Agent一张地图」，通过渐进式披露机制，让Agent从高层概览出发，按需深入到具体节点，而不是一开始就被海量信息淹没。其次，Spec是约束生效的语义基础。虽然linter可以机械地强制执行格式层面的约束，但语义层面的约定——如跨服务的错误码处理、接口字段的业务含义、状态流转规则——必须显式写入Spec，Agent才能正确推理。第三，Spec是反馈回路的正确性判据。Harness的飞轮运转需要「发现错误」的前提，而这需要明确的正确性判据。Spec中的验收标准层（WHEN/THEN Scenario）正是提供了这个判据，让Agent的输出可以被自动对照验证。

为什么SDD反而更重要了

基于上述分析，答案变得清晰：SDD不仅没有失去意义，反而因为Harness的成熟而变得更为重要。Harness是放大器——它放大Agent的执行能力，也放大输入内容的影响。Spec写得好，Harness将其放大为可靠的、一致的、可验证的输出；Spec写得差，Harness则把Agent的猜测放大为高效率地产出错误。这类似于高速公路的护栏比自行车道更必要——不是因为车速更危险，而是因为速度更快、后果更严重。此外，SDD解决的是一个根本问题：将知识从「人脑+对话历史」转化为「仓库里版本化的结构化资产」，让设计决策和跨服务约定不会随人或会话流失。

🛡️

积墨 AI 安全隐患巡检系统

任务一键下达 · 隐患 AI 识别 · 整改全程留痕 · 报告一键生成。让安全巡检真正看得见、管得住、能闭环。

了解方案

如有侵权，请联系删除。

AI Agent Harness Engineering SDD 规范驱动开发 AI工程实践积墨AI AI智能体 AI智能体平台私有化AI智能体平台企业级AI智能体

Share This Post

🦞

JimoClaw 桌面 AI Agent 工作台

让 AI 处理本地资料 · 操控浏览器 · 交付可用文档

下载桌面版

Harness Engineering崛起，规范驱动开发还有价值吗？

Harness到底是什么

工程纪律的转移

JimoClaw — 桌面 AI Agent 工作台

Spec在Harness中的三个核心角色

为什么SDD反而更重要了

积墨 AI 安全隐患巡检系统

Popular Articles

企业级AI智能体如何突破效率孤岛，实现价值共振？

阿里通义Qwen模组：一周三次开源造势

积墨AI 7月更新日志

Related Articles

库克坦言涨价无可避免，行业真相：苹果已错失 AI 先发优势

2026-AI科学家-Nature：两天完成十年研究，加速科学发现新时代

阿里腾讯等大厂Agent同台交锋！年度AI智能体大会7月开幕

全国首家政医企共建AI医院成立；25项目招标超1.7亿；证监会支持AI大模型企业上市；多个医疗智能体发布

AI跨境电商交流会，探索'一人出海'新模式

PPT 从跑分到护栏：AI Agent 可观测和质量保障体系

Hermes Agent v0.17.0重磅发布：AI智能体的触达时代来了

Cursor 600亿美元卖给SpaceX，DeepSeek估值突破500亿：AI商业化两条截然不同的赢家路径

当AI贯穿消费到产业，618彻底变了

Fluss+Flink+AI Agent：淘宝交易实时风控智能体探索！

Cursor 600亿美元卖给SpaceX，DeepSeek估值突破500亿：AI商业化两条截然不同的赢家路径

公开课来了！第19讲：学习搭建生产排产与LCEL架构 AI 智能体

AI PCB生态专业展超75%展位售罄，首批展商选位圆满完成！10月引领全球产业风向

AI来了，中国动画电影反而更需要人了

AI时代的智能体先锋论坛

'梁文锋'们，上市有门了

AI Agent倒逼舱驾一体芯片成为刚需？

AI资本开支2.0

Harness Engineering崛起，规范驱动开发还有价值吗？

Harness到底是什么

工程纪律的转移

JimoClaw — 桌面 AI Agent 工作台

Spec在Harness中的三个核心角色

为什么SDD反而更重要了

积墨 AI 安全隐患巡检系统

Popular Articles

企业级AI智能体如何突破效率孤岛，实现价值共振？

阿里通义Qwen模组：一周三次开源造势

积墨AI 7月更新日志

Related Articles

库克坦言涨价无可避免，行业真相：苹果已错失 AI 先发优势

2026-AI科学家-Nature：两天完成十年研究，加速科学发现新时代

阿里腾讯等大厂Agent同台交锋！年度AI智能体大会7月开幕

全国首家政医企共建AI医院成立；25项目招标超1.7亿；证监会支持AI大模型企业上市；多个医疗智能体发布

AI跨境电商交流会，探索'一人出海'新模式

PPT 从跑分到护栏：AI Agent 可观测和质量保障体系

Hermes Agent v0.17.0重磅发布：AI智能体的触达时代来了

Cursor 600亿美元卖给SpaceX，DeepSeek估值突破500亿：AI商业化两条截然不同的赢家路径

当AI贯穿消费到产业，618彻底变了

Fluss+Flink+AI Agent：淘宝交易实时风控智能体探索！

Cursor 600亿美元卖给SpaceX，DeepSeek估值突破500亿：AI商业化两条截然不同的赢家路径

公开课来了！第19讲：学习搭建生产排产与LCEL架构 AI 智能体

AI PCB生态专业展 超75%展位售罄，首批展商选位圆满完成 ！10月引领全球产业风向

AI来了，中国动画电影反而更需要人了

AI时代的智能体先锋论坛

'梁文锋'们，上市有门了

AI Agent倒逼舱驾一体芯片成为刚需？

AI资本开支2.0

AI PCB生态专业展超75%展位售罄，首批展商选位圆满完成！10月引领全球产业风向