Agent Harness解析:智能体架构深度拆解

2026年5月11日

16

452

Agent Harness解析:智能体架构深度拆解

当你搭建过一个聊天机器人、接入了ReAct循环、挂载了几个工具,演示效果看似不错。但尝试将其投入生产环境时,问题随之涌现:模型记不住三步前做了什么,工具调用静默失败,上下文窗口被垃圾信息填满。问题的根源不在模型本身,而在于模型周围的一切——这正是Agent Harness要解决的核心问题。

生产级Harness的十二个核心组件

Agent Harness是包裹大语言模型的完整软件基础设施,这一概念在2026年初被正式命名,但早已存在于各种AI应用底层。它包含编排循环、工具调用、记忆机制、上下文管理、状态持久化、错误处理和安全护栏等关键要素。正如Beren Millidge在《作为自然语言计算机的脚手架LLM》中所做的精准类比:裸LLM是没有内存、没有硬盘、没有I/O的CPU。上下文窗口是内存,快但有限;外部数据库是硬盘,大但慢;工具集成是设备驱动;而Harness就是操作系统——我们重新发明了冯·诺依曼架构,因为这是任何计算系统的自然抽象。

循环的实际运作机制

综合Anthropic、OpenAI、LangChain等主流实践,一个生产级agent harness包含十二个独立组件。编排循环是系统心跳,实现思考-行动-观察(TAO)循环,也叫ReAct循环。工具是agent的手,以schema形式定义并注入到LLM上下文中。记忆在多个时间尺度上运作:短期记忆是单次会话内的对话历史,长期记忆跨会话持久化。上下文管理是很多agent悄然失败的地方——当关键内容落在窗口中间位置时,模型性能下降超过30%。此外还包括提示词构建、输出解析、状态管理、错误处理、安全护栏、验证循环和子agent编排。

我们重新发明了冯·诺依曼架构,因为这是任何计算系统的自然抽象。

“Beren Millidge”

主流框架的实现差异

一个完整循环的运作方式如下:第一步构建完整输入(系统提示+工具schema+记忆文件+对话历史+当前用户消息);第二步发送给模型API生成输出token;第三步进行输出分类——若只有文本无工具调用则循环结束,若请求工具调用则进入执行;第四步验证参数、检查权限、在沙盒环境中执行工具;第五步将结果格式化为LLM可读消息;第六步更新上下文并触发必要压缩;第七步返回第一步重复直到终止。Anthropic针对长时间运行任务开发了两阶段Ralph Loop模式,通过文件系统在上下文窗口之间提供连续性。

每个Harness面临的七个关键决策

Anthropic的Claude Agent SDK通过单一query()函数暴露Harness,运行时是一个「笨循环」,所有智能住在模型里。OpenAI的Agents SDK是「代码优先」的,工作流逻辑用原生Python表达。LangGraph将Harness建模为显式状态图。CrewAI实现基于角色的多agent架构。AutoGen(正在演化为微软Agent Framework)开创对话驱动的编排方式,支持五种编排模式:顺序、并发、群聊、移交和magentic。关键洞察是:脚手架在建筑完工后会被拆除,随着模型改进,Harness的复杂性应该降低。

如有侵权,请联系删除。

Related Articles

联系我们 获取方案
小墨 AI