Anthropic意外泄露的代码揭示了Agent Infra创业的底层逻辑

2026年4月1日

94

763

Anthropic意外泄露的代码揭示了Agent Infra创业的底层逻辑

2026年3月30日,Anthropic的工程师在发布npm包时犯了一个看似微小的错误——未在.npmignore中排除source map文件。正是这个疏忽,让57MB的cli.js.map文件指向了R2存储桶,51.2万行TypeScript源代码、1906个未经混淆的源文件在数小时内被镜像至GitHub,被fork数万次,形成了一次史无前例的“被动开源”。这不是官方意义上的开源,但效果却远超任何一次故意的代码发布。

三个被低估的工程细节

Claude Code的真实身份是什么?许多人此前认为它不过是“模型+提示词+工具调用”的轻量级包装,创业公司用几个月就能搭出MVP。代码泄露后,创业者们发现这是一剂清醒剂:Claude Code并非Anthropic Agent底座衍生出的编程产品,它就是底座本身——一个Agent操作系统底座,只是以产品化方式对外公开了。AI Coding as an Infrastructure,这与绝大多数AI编程创业公司甚至大厂的逻辑已经完全不同。

两个战略信号

泄露的代码中,query.ts是核心查询循环,800多行的状态机处理7种消息类型。其中三个工程细节尤为关键: 其一,四层上下文压缩。呈递进机制优先保持粒度,必要时才牺牲细节,而非简单截断——这是很多国产模型和Agent仍然存在的疏漏。这说明长任务、长对话是Anthropic押注的核心场景,Agent要连续工作数小时甚至数天,上下文管理就是命门。 其二,流式工具并行执行。模型生成和工具调用真正并行,而非排队。它优化的是Agent同时处理多任务的吞吐量,而非单纯缩短响应时间。 其三,多模式运行与递归计费。代码中存在交互式、嵌入式、持久后台三种运行模式,嵌套调用有独立的成本追踪,计费精细到子调用级别。这是一个平台级的复杂度,体现了Anthropic商业模式的精确度。

它对Anthropic的伤害不大,对创业者的启发不小

“业界观察”

泄露代码中散落着17个Feature Flag,其中大部分是产品探索方向,优先级不一。但有两个战略信号不容忽视:

第一个是KAIROS——持久后台代理,藏在隐藏模式里,已部分被实现。这意味着Anthropic认为Agent的终局形态不是你坐在电脑前跟它对话,而是它在后台自主运行,你在不在场没关系。这不是交互工具,而是后台基础设施,决定了整个Harness的设计方向:状态持久化、任务恢复、长时间运行的资源管理,全都是为“无人值守”准备的。 第二个是PROACTIVE——主动式AI,仍在实验阶段。传统Agent模式是人下指令AI执行,而PROACTIVE要反过来:AI主动发起行动,人负责审批。这是交互范式的根本翻转。KAIROS定义了Agent“在哪里跑”,PROACTIVE定义了Agent“谁说了算”,两者叠加描绘了一幅清晰图景:Agent不等你说话,自己决定干什么,在后台持续执行,你只需要偶尔审批。

边界之外的创业机会

这份泄露代码最大的价值,是让你看清Anthropic的疆域——哪些是已筑好的内核,哪些是尚未涉足的荒野。已筑好的内核不要轻易尝试:通用编排有800行状态机撑着,基础工具接入被MCP协议标准化,上下文压缩是四层工程护城河,成本追踪精细到递归子调用。在这些领域创业,等于正面撞Anthropic的操作系统底座。 但Anthropic没做的,恰恰是创业者的机会: 训练环境是确定性最高的方向。代码中taskBudget与maxTurns是任务限制系统的雏形,但仅此而已,没有完善的沙箱和专业 rollout 基础设施。模型能力刚过Agent可用门槛,但训练基础设施还停留在手工作坊阶段,供需错配最严重的窗口就是现在。 垂直行业技能同样重要。Claude Code的commands.ts提供了通用技能加载框架,但框架和行业知识是两层完全不同的工程。法律文书的引用格式、医疗记录的合规要求、金融模型的风控逻辑,这些不是通用框架能解决的。 独立评估是另一个可行方向。代码有logEvent记录每一步操作,但银行不会信任被审计方自己的工具做合规检查,医院也不会让AI自己评估自己的诊断质量

如有侵权,请联系删除。

Related Articles

联系我们 预约演示
小墨 AI