2026年5月11日

100

781

Agent的自我进化：从技能积累到SkillOS范式

大语言模型训练是一次性的投入。数百万美元训练出一个模型，知识便冻结在那一刻。然而部署环境瞬息万变——新的API上线、用户习惯改变、项目架构重构——这些变化不会等待模型更新。于是工程师们陷入无限循环：反复调校prompt、手动编写工具、持续维护技能库。成本高昂、迭代缓慢、难以扩展。是否有办法让Agent自主管理自身技能，并在使用中持续进化？社区将这一方向称为SkillOS——它不是某个具体项目的名称，而是一种范式转变：如同操作系统管理进程，Agent应自主管理技能的完整生命周期。

记忆操作系统：进化的基础设施

要实现自我进化，Agent需解决两个基础问题：能否记住自己做过什么，能否想清楚哪里做错了。反思机制与结构化记忆系统构成了进化的基础设施。Reflexion论文提出了一个简洁而有效的方案：让Agent用自然语言反思失败，将反思存入情景记忆，下次遇到类似问题时优先查阅。在HumanEval编程基准上，Reflexion达到91%的pass@1，超越了GPT-4裸跑的80%。这证明了一个关键洞察：自然语言本身就是改进的载体，Agent不需要梯度下降，需要的是“想清楚自己错在哪里”。

技能积累：从代码片段到结构化知识库

反思产生的洞察需要安放。MemOS提出“记忆操作系统”概念，将记忆分为三层：L1追踪层记录交互痕迹，L2策略层提炼行为模式，L3世界模型层形成高阶认知。三层之上还有“结晶技能”层——反复验证有效的策略从临时记忆固化为稳定技能。这模拟了人类学习过程：从刻意练习形成直觉，最终变成肌肉记忆。EverOS则采用超图结构组织记忆，在LoCoMo基准上达到92.73%的问答准确率。这些工作指向一个共识：记忆不是进化的附属品，而是基础设施。没有好的记忆管理，Agent每次都在重新发现已学过的东西。

自然语言本身就是改进的载体。Agent不需要梯度下降，需要的是想清楚自己错在哪里。

“研究观点”

技能库的开创与结构化演进

Voyager是技能库概念的起点。这个在Minecraft中持续探索学习的LLL Agent，通过自动课程、技能库和迭代提示三个核心组件，实现了技能的复利效应——每学会一个新技能，后续探索能力就更强。实验显示，收集物品数量是先前SOTA的3.3倍，行进距离2.3倍。然而Voyager的技能是平铺的，没有层次结构，当技能数量增长到数百个时，管理和检索成为瓶颈。SkillX将执行轨迹蒸馏为三层层次结构：战略计划、功能技能、原子技能。实验证明，GPT-4级别Agent产生的技能库能显著提升GPT-3.5级别Agent的表现，实现了跨Agent、跨环境的技能迁移。

符号学习与递归自改进

更根本的问题在于Agent能否像神经网络一样优化自身行为。Symbolic Learning将Agent流水线视为“符号网络”——prompts、tools及其组合方式就是可学习权重。Loss不是数值损失函数，而是自然语言描述的评估；Gradient不是数值梯度，而是自然语言描述的改进方向。AgentEvolver则落地为三个具体机制：自我提问解决训练数据来源、自我导航利用过去经验引导探索、自我归因分析执行轨迹中的因果关系。一个7B参数模型通过这套机制训练后，基准测试从15.8%提升到45.2%，提升近3倍。STOP实验更验证了递归自改进的可行性——让程序改进它自己，LLM甚至自主生成了束搜索、遗传算法等经典优化策略。

如有侵权，请联系删除。

Agent SkillOS 大模型自我进化人工智能积墨AI AI智能体 AI智能体平台私有化AI智能体平台企业级AI智能体

Share This Post

Agent的自我进化：从技能积累到SkillOS范式

记忆操作系统：进化的基础设施

技能积累：从代码片段到结构化知识库

技能库的开创与结构化演进

符号学习与递归自改进

Popular Articles

企业级AI智能体如何突破效率孤岛，实现价值共振？

阿里通义Qwen模组：一周三次开源造势

积墨AI 7月更新日志

Related Articles

【AI】Agent落地、千亿募资与算力军备：AI正在经历一场'去泡沫化'战争

AI+介入机器人：'智能协同'定义介入诊疗新趋势

反超OpenAI！Anthropic登顶全球最贵AI公司

从代码生成到智能体协同：源启双引擎重构企业AI落地新范式

智王AI量化智能体，五月封神：AGI在资本市场的初代力量

博泰车联：与英伟达举行战略合作签约仪式，双方围绕车载AI、自动驾驶、下一代计算平台及光通信等进行探讨

2026新政解读:智能体与AI终端的'双向奔赴',AIoT产业迎来三大价值重构

芮勇主讲：AI智能体的最新进展、挑战和机会

2026全球AI算力报告及算力产业十大趋势重磅发布

AI Open Day兰州龙虾大会圆满举办，共绘西北数字经济新蓝图

谷歌AI垂直整合战略，全世界都在静静观察

2026全球AI与Agent的演进与落地

Agent爆发周期，思格新能源画出了'AI+光储'时代的新坐标

AI编程Cognition融资超10亿美元，估值260亿美元，ARR 4.92亿美元

AI推理服务商Fireworks AI拟定新一轮融资，估值150亿美元

软银主导国产AI联盟又吸引15家公司投资

别在CVPR独自社恐了！来丹佛AI Talent Meetup，只聊你听得懂的技术与理想

临床试验革命！神经AI平台横空出世，FDA实时审查新政迎来首个落地者

Agent的自我进化：从技能积累到SkillOS范式

记忆操作系统：进化的基础设施

技能积累：从代码片段到结构化知识库

技能库的开创与结构化演进

符号学习与递归自改进

Popular Articles

企业级AI智能体如何突破效率孤岛，实现价值共振？

阿里通义Qwen模组：一周三次开源造势

积墨AI 7月更新日志

Related Articles

【AI】Agent落地、千亿募资与算力军备：AI正在经历一场'去泡沫化'战争

AI+介入机器人：'智能协同'定义介入诊疗新趋势

反超OpenAI！Anthropic登顶全球最贵AI公司

从代码生成到智能体协同：源启双引擎重构企业AI落地新范式

智王AI量化智能体，五月封神 ：AGI在资本市场的初代力量

博泰车联：与英伟达举行战略合作签约仪式，双方围绕车载AI、自动驾驶、下一代计算平台及光通信等进行探讨

2026新政解读:智能体与AI终端的'双向奔赴',AIoT产业迎来三大价值重构

芮勇主讲：AI智能体的最新进展、挑战和机会

2026全球AI算力报告及算力产业十大趋势重磅发布

AI Open Day兰州龙虾大会圆满举办，共绘西北数字经济新蓝图

谷歌AI垂直整合战略，全世界都在静静观察

2026全球AI与Agent的演进与落地

Agent爆发周期，思格新能源画出了'AI+光储'时代的新坐标

AI编程Cognition融资超10亿美元，估值260亿美元，ARR 4.92亿美元

AI推理服务商Fireworks AI拟定新一轮融资，估值150亿美元

软银主导国产AI联盟又吸引15家公司投资

别在CVPR独自社恐了！来丹佛AI Talent Meetup，只聊你听得懂的技术与理想

临床试验革命！神经AI平台横空出世，FDA实时审查新政迎来首个落地者

智王AI量化智能体，五月封神：AGI在资本市场的初代力量