智能体需要“太平洋”而非“海洋馆”

2026年3月31日

63

435

智能体需要“太平洋”而非“海洋馆”

在海洋馆里,虎鲸能够完成各种精彩表演:翻滚、跃出水面、顶球、与训练师配合完成复杂动作。观众会觉得它聪明、灵活,甚至善解人意。但我们很难忽略一个事实——虎鲸本不属于这里。在真正的大海,虎鲸会游上万公里,用声呐感知整个海洋,与同类协同捕猎,在洋流、温度、地形不断变化的系统中持续做出选择。它的能力从来不只是为人类完成一系列预设动作,而是在极其复杂的空间里找到生存繁衍的路径。

把智能体放归大海

今天的企业AI系统,正在经历同样的困境。大多数企业在引入AI时,第一步往往是梳理流程:先查什么、再看什么、按照什么顺序处理、最后输出什么格式。每一步都设计得很清晰,系统上线后也确实能跑,效率提高、出错率下降,一切看起来都在正轨上。但这种系统有一个稳定的特征——它始终沿着人已经走过的路径前进。它可以更快、更稳定地完成这些路径,却很少偏离它们。时间一长,这样的“智能体”更像一个执行能力很强的流程系统,而非真正具有自主判断能力的智能体。

分析

问题不在于模型本身够不够强,而在于路径在一开始就被写好了。很多企业设计的workflow看起来合理——步骤清晰、逻辑完整、每一步都可解释,但它有一个隐藏的前提:系统只能沿着预设路径前进。这正是关键分水岭。目前最成功的智能体产品——Claude Code和OpenClaw——走的是完全不同的路。它们不预设路径,而是让模型自己去找。

不要试图把模型关进盒子里。给它工具,让它自己去找它需要的东西。效果会好得多。

“Boris Chernyshov”

这正是AI领域一个经典经验的体现——The Bitter Lesson(苦涩的教训)。这是强化学习之父Richard Sutton在2019年提出的观点:「当系统能力不断提升时,真正占优势的,往往不是人类预先设计好的路径,而是那些允许系统自己去搜索、去学习的方法。」国际象棋就是典型案例:几十年来最聪明的研究者把大师级直觉编成规则,直到1997年深蓝用暴力搜索击败卡斯帕罗夫。不是因为深蓝更懂棋,而是当棋盘规则被精确定义后,机器面对的搜索空间远超人类直觉能覆盖的范围。

在制造业,这个差别可以看得很清楚。纺织原料收储是一个典型例子——对年产值几十亿的纺织厂来说,原料成本占总成本的60-70%。什么时候买、买哪个产区、买多少,直接决定全年利润。很多系统会把这个过程拆成固定步骤——先查价格、再看库存、最后算均价给出建议。运行稳定,但只是在复现既有经验。而当决策记录、变量关系(时机×价格×产区×品类×资金状况)、资金与仓储硬约束被组织成一个完整空间,路径就不再固定。它可能发现老采购从未注意到的规律:某个产区在9月的价格异常,连续出现了8年。

企业里的判断,本质上是在一个约束很多的环境里找解。真正带来差异的,往往不是把已有路径执行得更好,而是找到一条之前没被稳定看见的路径。人之所以很难找到这些路径,恰恰因为经验本身会收缩搜索范围——你会优先看到熟悉的模式,优先走已经验证过的路线。这在大多数时候是优势,但在复杂环境里,它同时也是限制。系统一旦能在更大的空间里展开搜索,就会覆盖到人类经验之外的解。

锂电池质检的灰区判断更能说明问题。困难从来不在明显的合格与不合格,而在中间那一大片需要权衡的区域。不同客户、不同用途、不同成本条件下,判断的边界会发生变化。固定阈值能提供确定性,却很难捕捉这种动态变化。印染厂污水处理也是如此。排放标准是硬约束,但在这个前提下,药剂投放、电价时段、处理效率之间存在大量组合空间。固定配方带来稳定,动态搜索带来优化空间。这些场景的共同点是:路径不再唯一,企业需要的是在约束空间内让AI自主探索。

如有侵权,请联系删除。

Related Articles

联系我们 预约演示
小墨 AI