2026年3月24日

780

上下文工程的六大支柱之：压缩与编排

在构建高效AI应用的过程中，我们不可避免地面临一个根本性的物理限制：模型的上下文窗口是有限的。即便拥有百万级Token的超级模型，处理长上下文所需的时间、算力和成本同样不容忽视。这便引出了上下文工程的第三大支柱——压缩（Compression）。压缩的核心目标，是在将上下文送入大语言模型之前，通过各种技术手段，在尽可能不损失关键信息的前提下，显著减小其Token数量。这是一门在“信息保真度”和“成本效益”之间寻求最佳平衡的艺术。

压缩的两种哲学：抽取式与抽象式

信息密度的挑战是压缩技术产生的根本原因。从记忆系统中检索出的上下文，往往包含大量冗余和低信息密度内容。例如，一篇完整的技术文档，对于回答一个具体问题来说，可能只有几个段落是真正关键的。将整篇文档塞入上下文，不仅浪费了宝贵的窗口空间，也可能因引入过多噪声而干扰模型的注意力。压缩就是要提升最终送入模型上下文的“信息密度”，确保每一个Token都尽可能为回答问题贡献价值。

Selective Context与LLMLingua技术

上下文压缩主要有两种技术路线。抽象式压缩使用一个大语言模型来重写或总结原始上下文，生成更短的版本，其优点是能生成流畅连贯的文本，但缺点是可能在总结过程中丢失关键细节或引入幻觉。抽取式压缩则不生成新文本，而是从原始上下文中识别并抽取出最重要的部分，然后将它们拼接在一起。这种方法的优点是能最大程度保留原始信息的“原汁原味”，避免二次生成带来的信息失真。近年来，抽取式压缩因其高保真度和可控性，成为研究和应用的热点。

压缩是在信息保真度与成本效益之间寻求最佳平衡的艺术，而编排则让系统从体力劳动走向脑力劳动。

“编辑观点”

编排：从静态管道到动态决策

在抽取式压缩领域，Selective Context提出了一种巧妙的思路：利用信息论中的“自信息”或“困惑度”来判断一个词或句子的信息量。困惑度越低的句子，意味着它越符合语言模型的“预期”，其包含的意外信息就越少。该方法使用小型语言模型计算每个句子的困惑度，然后根据困惑度从高到低排序，优先保留那些让模型“感到意外”的、信息量大的句子。而LLMLingua则将压缩问题看作一个“指令遵循”问题，其核心理念是用一个更小的、专门负责压缩的LLM来为昂贵的大模型“预处理”上下文。它通过指令感知的重要性分析、粗细粒度压缩和迭代优化，可以在压缩掉高达20倍Prompt长度的同时，仍保持与使用完整上下文相近甚至更好的性能。

然而，一个真正智能的系统，其上下文处理流程不应该是一条僵化的、线性的流水线。这便引出了上下文工程的第四大支柱——编排（Orchestration）。编排的核心目标是根据当前任务的动态需求，智能地、自适应地决定“应该使用哪些上下文”、“从哪里获取它们”以及“如何将它们组合在一起”。实现动态编排主要依赖两大核心机制：路由（Routing）和代理（Agentic）。路由器是一个前置决策模块，通常由轻量级LLM充当，在正式执行任务前对用户请求进行分析和分类，将其路由到最合适的处理路径上。代理式编排则是一种更高级的多步骤动态决策过程，系统不再是被动管道，而是一个主动的Agent，拥有思考、规划和使用工具的能力，会根据任务进展迭代地、自适应地调整其上下文获取策略。

如有侵权，请联系删除。

大模型上下文工程 RAG AI架构积墨AI AI智能体 AI智能体平台私有化AI智能体平台企业级AI智能体

Share This Post

上下文工程的六大支柱之：压缩与编排

压缩的两种哲学：抽取式与抽象式

Selective Context与LLMLingua技术

编排：从静态管道到动态决策

Popular Articles

企业级AI智能体如何突破效率孤岛，实现价值共振？

阿里通义Qwen模组：一周三次开源造势

积墨AI 7月更新日志

Related Articles

晶耀智远刘钢将出席2026人工智能基础设施峰会：OpenClaw开启AI Infra智能体主机新纪元

【伦敦】针对一线劳动力管理的AI平台 Sona 完成 4500 万美元 B 轮融资，加速美国扩张与一线运营系统重构

【伦敦】针对一线劳动力管理的AI平台 Sona 完成 4500 万美元 B 轮融资，加速美国扩张与一线运营系统重构

龙虾引爆！医疗Agent狂飙，蚂蚁京东百度争相布局，AI医疗又一重磅风口！

GEO智领增长，AI Agent重构全域引擎——AI创新营销工作坊圆满举办

OpenClaw开源AI Agent平台快速崛起，折射个人智能代理时代加速到来（2026年）

线上】AI基础设施技术测试周

《AI智能体（Agent）赋能制造管理提效》

Figure AI 实现每90分钟下线一台人形机器人

GEO智领增长，AI Agent重构全域引擎——AI创新营销工作坊圆满举办

影目科技 印传学：AI+AR智能眼镜 从破圈到发展趋势预判

美国EdgeRunner AI公司推出军用版OpenClaw——WarClaw，实现战术边缘智能体决策优势

掘金东南亚！2026全球AI+IoT产业生态高峰论坛（新加坡）诚邀共拓蓝海

Anthropic深入生命科学领域，以4亿美元收购Coefficient Bio

LLM Agent在规划教学中的探索

【行业动态】Figure AI 实现每90分钟下线一台人形机器人

【Gartner报告精选】预测2026；重要战略技术趋势；中国AI算力管理平台；中国市场指南

LightCounting：AI如何重塑光学行业

运营商向Token价值经营转型，持续看好AI产业投资机会

Q1全球VC 3000亿美元AI占八成创纪录；Sarvam AI 3亿美元成印度最大AI融资；特朗普对药品加征100%关税

Q1全球VC 3000亿美元AI占八成创纪录；Sarvam AI 3亿美元成印度最大AI融资

从OpenClaw看透AI Agent产业链

【第66期】医械+AI行业动态●皕晟周报速递（2026.3.27-2026.4.3）

AI-GEO+OPC双赛道红利，4月11日深圳开启

月度路演 2026年4月 “AI x 先进制造”主题，项目&观众报名开启

小红书、京东、蚂蚁、平安等7位专家复盘AI落地实战，2026奇点智能技术大会「AI+行业落地实践」专题揭晓

解锁AI营销新范式，共赴2026首届AI+营销数字转型峰会

【4.17-4.20/成都】智能体（AI Agent）赋能教学创新：理论、工具与智慧课程建设实践研讨班

AI赋能成长，智启就业新程

中国AI，最新趋势来了！

4亿美元收购，万亿独角兽杀入AI制药；瑞盛生物完成收购常州天宁龙洋金铂利口腔门诊部51%股权

Helidon 引入 Agent 能力，Java 框架开始内建 AI 编排

【中泰传媒】康雅雯：AI技术迭代与商业化加速，国产大模型全球化竞争力凸显

英伟达发布《2026年医疗健康与生命科学领域AI应用现状报告》

从豆包AI手机到学而思'小精龙'：AI Agent正在拆开教育的'黑箱'

AI算力'命脉级'硬件，OCS行业爆发前夜，5家A股公司抢先布局

三天实战手把手 AI智能体实操特训

围观巅峰对决！首届“AI智能体+”大赛决赛，邀你共同见证！

Agentic AI Summit深圳大会启动，别只谈Agent理想，来深圳解决Agent落地后的'脏活累活'

政策落地：AI+电商10家核心概念股盘点

从豆包AI手机到学而思“小精龙”：AI Agent正在拆开教育的“黑箱”

全球首个射频大模型 RF‑GPT 发布！AI 终于看懂无线信号，6G 认知革命来了

探索具身智能前沿：信息与智能工程学院专业教师为学生深度解读Agent AI

388万元，AI智能体大单：火山引擎中标

“2026 FORCE LINK AI 创新巡展・武汉站”成功举办！

刷爆全网！2026最火科技：AI Agent不再是概念，人人都能拥有专属'数字员工'

从聊天到行动：2026年AI Agent如何重塑人机协作

【投融资】2亿视频、2840万美元收入，AI音视频应用Captions更名Mirage，GeneralCatalyst注资7500万美元

普华永道：金融机构AI投资回报已达10%-15%，大规模推广AI仍有困难

从聊天到行动：2026年AI Agent如何重塑人机协作

41岁程序员靠AI年入4亿美元：普通人如何抓住这波AI红利？

刷爆全网！2026最火科技：AI Agent不再是概念，人人都能拥有专属'数字员工'

深圳4月AI智能体培训开启：手把手教学！从0-1构建你的第一个Agent，用AI工具变现！

“AI+制造”的范式革命

探索具身智能前沿：信息与智能工程学院专业教师为学生深度解读Agent AI

一夜变天，Anthropic正式封杀OpenClaw！全球开发者24小时血崩

灵伴科技CEO祝铭明：AI 眼镜重构产业生态 余江应以认知更新拥抱智能未来

57k Star霸榜GitHub！字节这款超级智能体，凭何让全球AI圈真香？

灵伴科技CEO祝铭明：AI 眼镜重构产业生态 余江应以认知更新拥抱智能未来

博联率先接入 QClaw，以微信开启全屋智能 AI Agent 新时代

博联率先接入 QClaw，以微信开启全屋智能 AI Agent 新时代

AI手术机器人企业磅策医疗完成亿元B轮融资，构筑AI消费医疗新生态

北京大学《OpenClaw001：龙虾使用入门》开启个人 AI Agent 平民化时代

甲子光年：AI原生组织——OpenClaw推动组织形态重塑 2026

南京分院政企数智项目组 AI 系列研讨（四）AI Agent 技术体系深度解析

智能体全面开花，产业链做好落地准备了吗？AI Agent专场沙龙全链路洞察清智资本、华为、MiniMax……

多模态开放模型、AI 驱动内核优化与 Agent 原生支付（2026.04.03）

主权 AI 基建、Agent 基础设施与边缘优先（2026.04.02）

共拓百亿级金融通用智能体市场！阿里云联合百家伙伴吹响冲锋号

字节跳动披露豆包大模型日均 Token 突破 120 万亿/OpenAI 二级市场 6 亿美元股份无人接盘

【企业动态】深擎科技亮相阿里云金融 AI 联盟大会，以证券垂类 AI 能力共拓百亿智能体市场

影目科技印传学：AI+AR智能眼镜从破圈到发展趋势预判

灵伴科技CEO祝铭明：AI 眼镜重构产业生态余江应以认知更新拥抱智能未来

灵伴科技CEO祝铭明：AI 眼镜重构产业生态余江应以认知更新拥抱智能未来

NexusGen完成新一轮数千万级别融资，让AI回归个人掌控

AI Agent 落地实务全拆解解锁商科智能新玩法

五方六力赋能京苏双向奔赴