2026年5月11日

452

Agent Harness解析：智能体架构深度拆解

当你搭建过一个聊天机器人、接入了ReAct循环、挂载了几个工具，演示效果看似不错。但尝试将其投入生产环境时，问题随之涌现：模型记不住三步前做了什么，工具调用静默失败，上下文窗口被垃圾信息填满。问题的根源不在模型本身，而在于模型周围的一切——这正是Agent Harness要解决的核心问题。

生产级Harness的十二个核心组件

Agent Harness是包裹大语言模型的完整软件基础设施，这一概念在2026年初被正式命名，但早已存在于各种AI应用底层。它包含编排循环、工具调用、记忆机制、上下文管理、状态持久化、错误处理和安全护栏等关键要素。正如Beren Millidge在《作为自然语言计算机的脚手架LLM》中所做的精准类比：裸LLM是没有内存、没有硬盘、没有I/O的CPU。上下文窗口是内存，快但有限；外部数据库是硬盘，大但慢；工具集成是设备驱动；而Harness就是操作系统——我们重新发明了冯·诺依曼架构，因为这是任何计算系统的自然抽象。

循环的实际运作机制

综合Anthropic、OpenAI、LangChain等主流实践，一个生产级agent harness包含十二个独立组件。编排循环是系统心跳，实现思考-行动-观察（TAO）循环，也叫ReAct循环。工具是agent的手，以schema形式定义并注入到LLM上下文中。记忆在多个时间尺度上运作：短期记忆是单次会话内的对话历史，长期记忆跨会话持久化。上下文管理是很多agent悄然失败的地方——当关键内容落在窗口中间位置时，模型性能下降超过30%。此外还包括提示词构建、输出解析、状态管理、错误处理、安全护栏、验证循环和子agent编排。

我们重新发明了冯·诺依曼架构，因为这是任何计算系统的自然抽象。

“Beren Millidge”

主流框架的实现差异

一个完整循环的运作方式如下：第一步构建完整输入（系统提示+工具schema+记忆文件+对话历史+当前用户消息）；第二步发送给模型API生成输出token；第三步进行输出分类——若只有文本无工具调用则循环结束，若请求工具调用则进入执行；第四步验证参数、检查权限、在沙盒环境中执行工具；第五步将结果格式化为LLM可读消息；第六步更新上下文并触发必要压缩；第七步返回第一步重复直到终止。Anthropic针对长时间运行任务开发了两阶段Ralph Loop模式，通过文件系统在上下文窗口之间提供连续性。

每个Harness面临的七个关键决策

Anthropic的Claude Agent SDK通过单一query()函数暴露Harness，运行时是一个「笨循环」，所有智能住在模型里。OpenAI的Agents SDK是「代码优先」的，工作流逻辑用原生Python表达。LangGraph将Harness建模为显式状态图。CrewAI实现基于角色的多agent架构。AutoGen（正在演化为微软Agent Framework）开创对话驱动的编排方式，支持五种编排模式：顺序、并发、群聊、移交和magentic。关键洞察是：脚手架在建筑完工后会被拆除，随着模型改进，Harness的复杂性应该降低。

如有侵权，请联系删除。

AI Agent LLM 技术架构积墨AI AI智能体 AI智能体平台私有化AI智能体平台企业级AI智能体

Share This Post

Agent Harness解析：智能体架构深度拆解

生产级Harness的十二个核心组件

循环的实际运作机制

主流框架的实现差异

每个Harness面临的七个关键决策

Popular Articles

企业级AI智能体如何突破效率孤岛，实现价值共振？

阿里通义Qwen模组：一周三次开源造势

积墨AI 7月更新日志

Related Articles

【AI】Agent落地、千亿募资与算力军备：AI正在经历一场'去泡沫化'战争

AI+介入机器人：'智能协同'定义介入诊疗新趋势

反超OpenAI！Anthropic登顶全球最贵AI公司

从代码生成到智能体协同：源启双引擎重构企业AI落地新范式

智王AI量化智能体，五月封神：AGI在资本市场的初代力量

博泰车联：与英伟达举行战略合作签约仪式，双方围绕车载AI、自动驾驶、下一代计算平台及光通信等进行探讨

2026新政解读:智能体与AI终端的'双向奔赴',AIoT产业迎来三大价值重构

芮勇主讲：AI智能体的最新进展、挑战和机会

2026全球AI算力报告及算力产业十大趋势重磅发布

AI Open Day兰州龙虾大会圆满举办，共绘西北数字经济新蓝图

谷歌AI垂直整合战略，全世界都在静静观察

2026全球AI与Agent的演进与落地

Agent爆发周期，思格新能源画出了'AI+光储'时代的新坐标

AI编程Cognition融资超10亿美元，估值260亿美元，ARR 4.92亿美元

AI推理服务商Fireworks AI拟定新一轮融资，估值150亿美元

软银主导国产AI联盟又吸引15家公司投资

别在CVPR独自社恐了！来丹佛AI Talent Meetup，只聊你听得懂的技术与理想

临床试验革命！神经AI平台横空出世，FDA实时审查新政迎来首个落地者

Agent Harness解析：智能体架构深度拆解

生产级Harness的十二个核心组件

循环的实际运作机制

主流框架的实现差异

每个Harness面临的七个关键决策

Popular Articles

企业级AI智能体如何突破效率孤岛，实现价值共振？

阿里通义Qwen模组：一周三次开源造势

积墨AI 7月更新日志

Related Articles

【AI】Agent落地、千亿募资与算力军备：AI正在经历一场'去泡沫化'战争

AI+介入机器人：'智能协同'定义介入诊疗新趋势

反超OpenAI！Anthropic登顶全球最贵AI公司

从代码生成到智能体协同：源启双引擎重构企业AI落地新范式

智王AI量化智能体，五月封神 ：AGI在资本市场的初代力量

博泰车联：与英伟达举行战略合作签约仪式，双方围绕车载AI、自动驾驶、下一代计算平台及光通信等进行探讨

2026新政解读:智能体与AI终端的'双向奔赴',AIoT产业迎来三大价值重构

芮勇主讲：AI智能体的最新进展、挑战和机会

2026全球AI算力报告及算力产业十大趋势重磅发布

AI Open Day兰州龙虾大会圆满举办，共绘西北数字经济新蓝图

谷歌AI垂直整合战略，全世界都在静静观察

2026全球AI与Agent的演进与落地

Agent爆发周期，思格新能源画出了'AI+光储'时代的新坐标

AI编程Cognition融资超10亿美元，估值260亿美元，ARR 4.92亿美元

AI推理服务商Fireworks AI拟定新一轮融资，估值150亿美元

软银主导国产AI联盟又吸引15家公司投资

别在CVPR独自社恐了！来丹佛AI Talent Meetup，只聊你听得懂的技术与理想

临床试验革命！神经AI平台横空出世，FDA实时审查新政迎来首个落地者

智王AI量化智能体，五月封神：AGI在资本市场的初代力量