By 小墨
2026年6月18日
85
826
如何为你的 Skills 构建自我改进循环
在AI Agent的开发实践中,“循环(Loop)”是一个被频繁提及的概念。然而,如何将这个抽象概念落地为可操作的工程方案,却让许多开发者感到困惑。本文将介绍一种经过验证的方法:通过 Skills 与云端 Agent 的配合,构建一个真正有效的自我改进循环系统。这套机制的核心价值在于,它不仅让 Agent 执行任务,更让 Agent 能够根据真实反馈持续优化自身的工作方式。
概述
自我改进循环的核心理念可以概括为:Agent 根据外部反馈,持续提升自身 Skills 的质量。这里的外部反馈既可以来自人工审核,也可以来自自动评分器。以一个常见的 issue 分诊场景为例:Agent 需要将新提交的 issue 分类为“待实现”、“重复问题”或“需要补充信息”。传统做法是一次性设计好规则然后反复运行,而自我改进循环的思路则完全不同:它会记录每次分类的结果,收集反馈,然后根据反馈不断修正分类规则本身。
什么是自我改进循环
整个系统由两个相互配合的循环构成。内层 Agent 循环负责实际执行 Skill 任务。以 GitHub issue 分诊为例,每次有新 issue 创建时,系统自动触发云端 Agent 运行分诊 Skill,对 issue 进行分类并打上标签。Skill 的每一次交互都会被完整记录,无论是存储为文件、Agent trace 还是外部系统中的交互记录。外层 Agent 循环则是一个按计划运行的观察者与改进者。它会定期拉取内层循环的运行记录,分析这些结果,判断 Skill 中哪些规则、判断逻辑或示例需要调整,然后生成改进建议(diff)。这个改进后的 Skill 反向进入内层循环,驱动下一轮任务执行。
Agent 不应该只是一次性执行任务的工具,它也可以成为一个持续观察、持续学习、持续改进的系统。
“AI技术评论”双层循环的协同机制
Skills 之所以非常适合构建自我改进循环,根本原因在于它们本质上是文件。这意味着 Skills 可以被读取、比较、修改、提交和合并。从工程化角度看,Skill 的改进过程与代码改进过程高度相似:观察运行结果、发现问题、修改文件、生成 diff、发起合并。这种相似性让 Agent 不只是执行工具,而可以参与到工具自身的迭代过程中。当 Skills、云端 Agent、外部反馈和版本控制结合之后,原本依赖人工经验积累的流程就能变成可复用、可审查、可持续优化的工程化闭环。
Skills 为何适合构建自我改进循环
自我改进循环特别适合那些重复发生且有明确反馈信号的任务,包括 issue 分诊、代码审查、Bug 修复、事故响应、客服工单分类、安全告警分析等。这类任务的共同特点是:一开始很难把规则写得完美,但可以通过大量真实案例不断校正。需要注意的是,如果任务很少重复、缺乏清晰反馈信号或高度依赖主观判断,则不太适合采用这种机制。落地时建议从小规模开始,例如先实现一个只做三分类的简单 Skill,只记录“人工是否修改标签”和“修改原因”两类反馈,让外层 Agent 定期分析并提出改进建议。初期可以让 Agent 生成 diff,由人类 review 后再合并,这样既能形成改进循环,又能有效控制风险。
如有侵权,请联系删除。
Related Articles
-
Sun Jun 21 2026库克坦言涨价无可避免,行业真相:苹果已错失 AI 先发优势
2026年6月19日,苹果 CEO 蒂姆·库克在采访中直言,由于全球内存芯片等关键部件成本上升,苹果面临全线产品涨价的现实压力。外界解读该轮涨价不仅是成本传导,也是苹果在AI时代竞争力变化的反映。
-
Sun Jun 21 20262026-AI科学家-Nature:两天完成十年研究,加速科学发现新时代
谷歌DeepMind、谷歌研究院与谷歌云团队在《自然》期刊发布基于 Gemini 的多智能体系统 Co-Scientist。该系统由多个专责智能体组成,覆盖假设生成、实验设计、数据分析与交互总结等环节
-
Sun Jun 21 2026阿里腾讯等大厂Agent同台交锋!年度AI智能体大会7月开幕
2026 中国 AI 智能体大会将于 7 月在杭州举办,主题为“范式跃迁 重塑世界”。大会汇聚了来自阿里、腾讯等大厂的 Agent 团队与 70 位重量级嘉宾,设置了企业级智能体专题论坛、产品创新论坛
-
Sun Jun 21 2026全国首家政医企共建AI医院成立;25项目招标超1.7亿;证监会支持AI大模型企业上市;多个医疗智能体发布
光谷人工智能医院宣布成立,这是国内首家由政府、医院与 AI 企业共建的医疗机构,旨在将 AI 技术深度融入临床与医疗服务环节,提高诊疗效率与服务覆盖能力。
-
Sat Jun 20 2026AI跨境电商交流会,探索'一人出海'新模式
2026年6月的交流会宣布了MoonClaw这一面向跨境电商的AI智能体,目标是将传统的多角色、多环节电商流程浓缩为一个可自动化执行的智能体体系,为个人或小团队出海提供一整套支撑。
-
Sat Jun 20 2026PPT 从跑分到护栏:AI Agent 可观测和质量保障体系
该PPT资料全面介绍了从性能跑分到安全护栏的AI Agent质量保障体系,列举了标准、评估指南与产业实践,帮助团队建立可观测且有保障的智能体服务。
-
Sat Jun 20 2026Hermes Agent v0.17.0重磅发布:AI智能体的触达时代来了
Hermes Agent 发布了 v0.17.0(The Reach Release),这是一次规模与深度兼具的更新,覆盖大量提交与合并请求,旨在提升智能体的触达能力与协作效率。
-
Sat Jun 20 2026Cursor 600亿美元卖给SpaceX,DeepSeek估值突破500亿:AI商业化两条截然不同的赢家路径
2026年6月,AI行业出现两件具有象征意义的大事:Cursor 的母公司 Anysphere 被 SpaceX 以全股票方式收购,交易规模达600亿美元;与此同时,中国公司 DeepSeek 完成了
-
Sat Jun 20 2026当AI贯穿消费到产业,618彻底变了
2026年618大促成为国内电商首次实现AI全场景、全产业深度渗透的标志:从消费者触达、商品推荐到仓储履约、工业采购,AI技术覆盖了零售运转的各个环节,带来体验和效率的双重跃迁。
-
Sat Jun 20 2026Fluss+Flink+AI Agent:淘宝交易实时风控智能体探索!
近年来电商交易规模与复杂度持续增长,实时风控成为保障平台安全与用户体验的关键。文章介绍了基于 Fluss 与 Flink 的实时流式处理结合 AI Agent 的技术探索,目标是在毫秒级完成数据采集、
-
Sat Jun 20 2026Cursor 600亿美元卖给SpaceX,DeepSeek估值突破500亿:AI商业化两条截然不同的赢家路径
报道指出 SpaceX 以 600 亿美元全股票交易收购 Anysphere(Cursor 母公司),创下 AI 与开发者工具领域的重大并购案例。同时中国公司 DeepSeek 完成大额融资,估值突破
-
Fri Jun 19 2026公开课来了!第19讲:学习搭建生产排产与LCEL架构 AI 智能体
现代职业教育网的《职见AI》栏目推出第 19 期公开课,主题为生产排产与 LCEL 架构 AI 智能体,旨在将学术研究与企业实战结合,提升制造业智能化能力。
-
Fri Jun 19 2026AI PCB生态专业展 超75%展位售罄,首批展商选位圆满完成 !10月引领全球产业风向
2026电子半导体产业创新发展大会暨国际电子电路(大湾区)展览会首轮选位顺利完成,首批展商选位圆满落定,超75%展位已被预订,显示业内对AI PCB与高端电子封装的强烈需求。
-
Fri Jun 19 2026AI来了,中国动画电影反而更需要人了
文章从行业视角出发,讨论 AI 技术在中国动画电影中的应用与影响,指出虽然 AI 能在制作环节显著提升效率,但创作灵魂与叙事深度仍然依赖人类创作者。
-
Fri Jun 19 2026AI时代的智能体先锋论坛
CCF TF技术前线第180期将以'AI时代的智能体先锋论坛'为主题,汇聚行业实战专家与学术权威,共同探讨智能体工程与多Agent协同的前沿问题与落地路径。
-
Fri Jun 19 2026'梁文锋'们,上市有门了
在陆家嘴论坛上,证监会宣布科创板第五套标准将覆盖AI大模型企业,并提出申报企业需具备至少一款已上线并实现规模化应用的大模型,明确了政策支持与监管要求。
-
Fri Jun 19 2026AI Agent倒逼舱驾一体芯片成为刚需?
文章分析了AI智能体对汽车芯片产业的影响,指出当智能体从云端对话走向端侧执行时,对算力、通信与功耗提出了新的工程约束,进而推动舱驾一体芯片的需求上升。
-
Fri Jun 19 2026AI资本开支2.0
摩根大通最新研报系统性上调了2026-2030年AI基础设施的资本开支预期,认为在生成式AI与智能体迅速落地的驱动下,基础设施投入将迎来新一轮爆发。
