By 小墨
2026年5月22日
58
457
大模型Agent长任务记忆压缩方案:上下文卸载与结构化画布实战
在处理长任务时,大模型Agent面临一个核心挑战:随着任务推进,上下文窗口会积累大量中间结果、工具输出和历史信息。这不仅导致Token快速耗尽,更会造成模型的“注意力涣散”——当上下文长度超过窗口的80%时,推理能力会显著下降。如何在保持任务连贯性的同时有效管理记忆,成为提升Agent性能的关键问题。
结语
本文提出一种基于上下文卸载与结构化图表示的短期记忆压缩方案。其核心思想是将完整信息卸载至外部文件系统,同时利用Mermaid图语言将任务执行过程转化为可导航的结构化记忆。实验表明,该方案在超长Session中最高节省61%的Token,同时将任务通过率从33%提升至50%,相对提升达52%。
符号化压缩的设计原则
对大模型而言,压缩的本质是将稀疏信息提炼为稠密信息。然而,并非所有短表达都是有效压缩——真正可用的压缩应依赖模型能够从符号中推理出结构,而非依赖模型“记住了什么特定符号”。经过多次实验,我们总结出三条设计原则:一是符号必须是通用知识(如Mermaid语法),确保所有主流模型都能理解;二是符号生成不能过于复杂,避免语义偏移;三是表达要足够自由,让模型能根据实际情况灵活调整。
好的表达不是信息更少,而是信息密度更高。
“本文观点”Mermaid无限画布:突破物理窗口的认知空间
在工程实现中,我们将记忆分为四个层级:Level 0是原始信息,存入refs/*.md文件;Level 1是工具调用级摘要,存入JSONL;Level 2是任务步骤级摘要,存入MMD文件;Level 3是任务级元数据,只保留目标、状态和时间戳。信息会根据上下文压力逐级降级——当压力升高时,系统会自动折叠低优先级信息,保留关键入口。召回时也是分层进行:先从元数据找到任务入口,再打开MMD查看任务进度,必要时再追溯JSONL和原文。
四层记忆架构:从压缩到召回
我们在SWEbench、Toolathlon、WideSearch和AA-LCR四个评测集上进行了超长Session压力测试。结果显示:代码修复任务中Token节省31%-33%,完成率相对提升9.93%;复杂长任务中通过率从20%提升至35%;网页搜索任务中通过率相对提升51.52%,Token节省最高达61.38%。值得注意的是,压缩并非简单删除信息,而是将不同粒度信息放到合适位置——当前上下文变轻了,但任务链路没有断裂。
如有侵权,请联系删除。
Related Articles
-
Tue Jun 02 2026从思考到行动:智能体时代的可信 AI
清华大学发起的专题报告深入探讨智能体时代的可信AI问题,研究者从模型能力演进路径出发,审视在模型具备推理与行动能力后如何保证其行为的可靠性与可验证性。
-
Tue Jun 02 2026独家赛道突围!华清未央领跑机器语言大模型赛道;颠覆3D内容行业!这家AI新贵完成巨额融资,国资+产业龙头全线押注
近日,华清未央宣布完成超亿元Pre-A轮融资,由多家资本机构及产业方参与,旨在加速其机器语言大模型的研发与规模化应用。公司聚焦程序理解、软件资产治理与AI安全等关键场景,希望以模型能力提升软件开发与运
-
Tue Jun 02 20262026中国AI智能体领航者产业图谱发布
在北京网络安全大会(BCS 2026)现场,组织方发布了《2026中国AI智能体领航者产业图谱》,该图谱覆盖20多个行业、100余家入选企业,旨在通过权威评审与公开展示,呈现中国智能体技术落地与产业创
-
Mon Jun 01 2026因思科技携AI智能体赋能数智运维,亮相第十七届石油化工设备维护检修技术交流会
沈阳因思科技在行业交流会上发布了因思云AI智能体系列,展示了动静设备一体化的数智运维解决方案与多种智能体产品。
-
Mon Jun 01 2026首发全域AI智能体,思格新能源在下一盘什么大棋?
思格新能源在其全球战略发布会上推出了行业首个全域AI智能体SigenAgent,宣称将AI能力覆盖光伏、储能与充电桩的全流程管理。
-
Mon Jun 01 2026黄仁勋与高通同日宣布2026为'智能体AI元年'!AI正从'聊天'走向'执行任务',算力战场全面切换
6月1日,两大芯片巨头英伟达与高通在不同场合同时提出2026为‘智能体AI元年’,共同描绘了智能体在云、端、车、机等多场景快速落地的蓝图。
-
Mon Jun 01 2026英伟达GTC 2026:智能体AI时代,全栈战略正式落地
GTC 2026上,英伟达正式展示其从GPU公司向AI基础设施公司的转型路线,强调智能体将成为未来计算的核心负载。
-
Mon Jun 01 2026黄仁勋:'有用的AI'已经到来
在COMPUTEX 2026大会上,英伟达CEO黄仁勋提出‘有用的AI’的命题,宣称智能体AI时代全面到来,并展示了公司在芯片与系统层面的新进展。
-
Mon Jun 01 2026阿里云亮相BEYOND Expo 2026:以全栈AI技术,激发Agentic时代的亚洲创新力
在澳门举办的BEYOND Expo 2026上,阿里云展示了其全栈AI技术与智能体产品,着重强调为企业与开发者提供从模型到产品化的端到端能力。
-
Mon Jun 01 2026北京人工智能项目融资路演推介会·投资机构邀请函
北京市委网信办联合经开区管委会将于2026年6月11日举办人工智能项目融资路演推介会,活动旨在为AI创业项目与投资机构搭建对接平台。
-
Mon Jun 01 2026深圳市物联网产业协会与术源万算签约,共筑AI智能体物联新生态
2026年6月1日,深圳市物联网产业协会与术源万算签署合作协议,双方将围绕AI智能体在物联网领域的应用展开深度协作,推动技术和产业层面的融合落地。
-
Mon Jun 01 2026刚刚!AI生成3D大模型,VAST完成近2亿美元A+轮融资,推出世界模型Project Eden
AI 3D生成公司VAST宣布完成近2亿美元A+轮融资,领投方包括渶策资本与国寿长三角科创基金,同时发布其世界模型Project Eden,标志着生成AI与具身智能研究的新进展。
-
Sun May 31 2026SpaceX IPO 目标估值降至至少 1.8 万亿美元/MiniMax 已启动中国境内 IPO 准备
近期资本市场对太空与AI相关公司的定价出现调整,SpaceX的IPO目标估值从此前的高位回落至约1.8万亿美元,这反映了市场对长期营收确定性的重新评估。
-
Sun May 31 2026OpenClaw.NET:AI工作流程机器人的网关架构深度解析
OpenClaw.NET作为自托管的AI Agent网关与运行时,采用模块化分层架构,旨在为生产环境提供可审计、可扩展且高性能的Agent网关解决方案,支持NativeAOT编译以优化部署体积与性能。
-
Sun May 31 2026聚焦'专业+AI应用',2026年人工智能赋能大学生就业能力提升师资培训在中央美院举办
中央美院举办的师资培训旨在提升高校教师对AIGC与AI应用的理解与教学能力,帮助他们将AI工具融入艺术与就业指导课程中。
-
Sun May 31 2026全球顶尖律所 Kirkland & Ellis 投资 5 亿美元,自研法律 AI 平台;知名精品所推出专有资产管理 AI 平台
Kirkland & Ellis 宣布将在未来三到四年内总计投入5亿美元用于开发定制化的法律 AI 平台,2026 年将先行投入约1亿美元以支持早期研发与落地试点。这一举措反映出大型律所希望摆脱对多种
-
Sat May 30 2026【报告】OpenClaw专题:OpenClaw引爆'龙虾'狂潮!万字拆解《重构与崛起》报告:Agent如何重构中国AI产业?
易观发布的《重构与崛起》报告全面梳理了OpenClaw开源框架如何在短时间内吸引大量关注,并推动企业与开发者围绕Agent能力进行产品与服务创新。
-
Sat May 30 2026【AI】Agent落地、千亿募资与算力军备:AI正在经历一场'去泡沫化'战争
进入 2026 年,AI 行业开始从能力竞赛转向商业化与可持续盈利的考量。技术厂商、资本方与政策制定者在算力、资金与合规上展开新一轮角力,推动市场加速整合与优胜劣汰。
