2026年4月21日

951

你写的Skill正在拖慢模型？策略式Gene才是正解

在企业AI应用落地过程中，很多工程师都会有这样一个困惑：明明已经将任务背景、详细流程、常见坑点、API用法、示例代码和注意事项全部写入了Skill文档，为什么模型在下一次执行同类任务时仍然会在同一个地方犯错？这个看似反直觉的现象，恰恰揭示了当前Agent经验复用机制的核心问题。

Skill文档的问题出在哪里

EvoMap团队（Infinite Evolution Lab × 清华大学）围绕这一问题进行了系统研究，通过45个科学代码场景下的4590次受控实验发现了一个令人惊讶的结论：完整的Skill文档包在两个测试模型上的平均表现反而低于无指导基线1.1个百分点，而仅有230个Token的Gene对象却比基线高出3.0个百分点。更关键的是，这个差异在强模型上更为显著——长Skill文档把Pro模型的固有能力直接压制了。

Gene：面向控制的知识表示

传统Skill文档通常包含Overview、Workflow、Pitfalls、Error Handling、API Notes、Examples、Scripts等多个章节看似完备的内容。然而实验结果表明，真正起作用的只有Workflow那一小段程序性内容，Overview反而是全文最大的负贡献。换句话说Skill文档中大量为人类可读性服务的信息材料，稀释甚至污染了控制信号。这并不是简单的信息量问题，而是受控对象的选择问题——给人看的东西塞进模型的执行预算，反而会成为控制噪声。

Agent不是在读一份说明书，而是在有限推理预算里寻找下一步该怎么做。

“EvoMap团队”

🦞

JimoClaw — 桌面 AI Agent 工作台

让 AI 处理本地资料、操控浏览器，最终交付可直接使用的文档、表格与 PPT，而不只是一段回答。

下载桌面版

GEP协议与实践经验沉淀

这一研究给行业带来的最大启示在于：Agent不是在「读一份说明书」，而是在「有限推理预算里寻找下一步该怎么做、什么必须避免」。当整个AI行业都在无脑卷更长的上下文、更花哨的RAG、更复杂的memory系统时，EvoMap给出了另一条朴素而有效的路径——让Agent持续变强的关键，不是把提示词写得更完整，而是把执行经验做成一个更紧凑、更可控、更可进化的对象。在多Agent经验交换的场景下，结构化的Gene对象也比传统的Skill文档更适合作为协议层载荷，因为它可以被匹配、替换、修订和验证，真正实现经验在多方之间的累积和进化。

经验对象设计的范式转移

预算对齐实验显示，即便将Skill的有效部分截短到与Gene相同的230个Token，Gene仍然全面碾压。这说明Gene赢的不仅是「短」，而是完全不同的形态——决定模型行为的是控制结构本身，而非Token数量。其中strategy层最为关键：将同样的字数组织成摘要毫无效果，但组织成策略则能显著提升表现。

🛡️

积墨 AI 安全隐患巡检系统

任务一键下达 · 隐患 AI 识别 · 整改全程留痕 · 报告一键生成。让安全巡检真正看得见、管得住、能闭环。

了解方案

如有侵权，请联系删除。

AI Agent Gene EvoMap 大模型提示词工程积墨AI AI智能体 AI智能体平台私有化AI智能体平台企业级AI智能体

Share This Post

🦞

JimoClaw 桌面 AI Agent 工作台

让 AI 处理本地资料 · 操控浏览器 · 交付可用文档

下载桌面版

你写的Skill正在拖慢模型？策略式Gene才是正解

Skill文档的问题出在哪里

Gene：面向控制的知识表示

JimoClaw — 桌面 AI Agent 工作台

GEP协议与实践经验沉淀

经验对象设计的范式转移

积墨 AI 安全隐患巡检系统

Popular Articles

企业级AI智能体如何突破效率孤岛，实现价值共振？

阿里通义Qwen模组：一周三次开源造势

积墨AI 7月更新日志

Related Articles

库克坦言涨价无可避免，行业真相：苹果已错失 AI 先发优势

2026-AI科学家-Nature：两天完成十年研究，加速科学发现新时代

阿里腾讯等大厂Agent同台交锋！年度AI智能体大会7月开幕

全国首家政医企共建AI医院成立；25项目招标超1.7亿；证监会支持AI大模型企业上市；多个医疗智能体发布

AI跨境电商交流会，探索'一人出海'新模式

PPT 从跑分到护栏：AI Agent 可观测和质量保障体系

Hermes Agent v0.17.0重磅发布：AI智能体的触达时代来了

Cursor 600亿美元卖给SpaceX，DeepSeek估值突破500亿：AI商业化两条截然不同的赢家路径

当AI贯穿消费到产业，618彻底变了

Fluss+Flink+AI Agent：淘宝交易实时风控智能体探索！

Cursor 600亿美元卖给SpaceX，DeepSeek估值突破500亿：AI商业化两条截然不同的赢家路径

公开课来了！第19讲：学习搭建生产排产与LCEL架构 AI 智能体

AI PCB生态专业展超75%展位售罄，首批展商选位圆满完成！10月引领全球产业风向

AI来了，中国动画电影反而更需要人了

AI时代的智能体先锋论坛

'梁文锋'们，上市有门了

AI Agent倒逼舱驾一体芯片成为刚需？

AI资本开支2.0

你写的Skill正在拖慢模型？策略式Gene才是正解

Skill文档的问题出在哪里

Gene：面向控制的知识表示

JimoClaw — 桌面 AI Agent 工作台

GEP协议与实践经验沉淀

经验对象设计的范式转移

积墨 AI 安全隐患巡检系统

Popular Articles

企业级AI智能体如何突破效率孤岛，实现价值共振？

阿里通义Qwen模组：一周三次开源造势

积墨AI 7月更新日志

Related Articles

库克坦言涨价无可避免，行业真相：苹果已错失 AI 先发优势

2026-AI科学家-Nature：两天完成十年研究，加速科学发现新时代

阿里腾讯等大厂Agent同台交锋！年度AI智能体大会7月开幕

全国首家政医企共建AI医院成立；25项目招标超1.7亿；证监会支持AI大模型企业上市；多个医疗智能体发布

AI跨境电商交流会，探索'一人出海'新模式

PPT 从跑分到护栏：AI Agent 可观测和质量保障体系

Hermes Agent v0.17.0重磅发布：AI智能体的触达时代来了

Cursor 600亿美元卖给SpaceX，DeepSeek估值突破500亿：AI商业化两条截然不同的赢家路径

当AI贯穿消费到产业，618彻底变了

Fluss+Flink+AI Agent：淘宝交易实时风控智能体探索！

Cursor 600亿美元卖给SpaceX，DeepSeek估值突破500亿：AI商业化两条截然不同的赢家路径

公开课来了！第19讲：学习搭建生产排产与LCEL架构 AI 智能体

AI PCB生态专业展 超75%展位售罄，首批展商选位圆满完成 ！10月引领全球产业风向

AI来了，中国动画电影反而更需要人了

AI时代的智能体先锋论坛

'梁文锋'们，上市有门了

AI Agent倒逼舱驾一体芯片成为刚需？

AI资本开支2.0

AI PCB生态专业展超75%展位售罄，首批展商选位圆满完成！10月引领全球产业风向