By 小墨
2026年5月21日
64
816
NaviRAG:让RAG系统学会“主动导航”的长文档问答优化方案
在处理长文档问答任务时,传统的RAG系统往往面临一个核心困境:如何高效地从海量文本中精准定位所需信息?过去几年,主流RAG方案采用“切块-建索引-相似度检索”的流水线式方法,这在简单问答场景表现尚可,但一旦遇到跨章节、多跳推理的复杂问题时便显得力不从心。清华大学联合南京大学、东北大学的研究团队近日提出了NaviRAG,为这一难题提供了新的解决思路。
导航检索的实现流程
传统RAG系统在长文档场景下面临三个主要瓶颈。首先是粒度两难问题:文本切得太细会导致片段缺乏上下文语境,模型难以理解完整含义;切得太粗则会引入过多噪声,关键证据被淹没。其次是被动一次性检索的局限——查询来时检索一次,拿到什么就是什么,信息不足也无法补充。第三个问题是扁平化处理忽视了文档天然的层次结构,目录、章节、子节之间的语义关系被完全忽略。GraphRAG、RAPTOR、HippoRAG等后续方案虽然做了诸多改进,但检索本身仍是一次性的被动过程,未能真正模拟人类查阅资料的认知模式。
性能表现与效率优势
NaviRAG的设计灵感来源于认知心理学中的信息觅食理论,该理论指出人类获取信息并非一次性抓取,而是沿着“信息气味”进行序列化探索——发现一条线索后顺藤摸瓜,信息不足就回头换路径。基于这一洞察,研究团队提出了“先定位、再觅食”的两阶段检索范式。第一阶段利用传统向量检索快速圈定相关语义子空间,避免在整 个语料库中盲目搜索;第二阶段则由LLM Agent沿着预先组织好的层次知识树自顶向下导航,每一步自主决定是“吸收当前节点”还是“继续向下展开”。这种设计的核心优势在于检索粒度不再是预先固定的,而是随查询需求动态调整——需要宽泛背景时停在高层摘要,需要具体证据时则下钻到叶子节点。
检索不是一次性的抓取,而是一个可导航的序列探索过程。
“研究团队”实验结果分析
NaviRAG的知识树构建分为三个步骤。第一步“搭骨架”:让LLM基于文档生成高层语义大纲,形成知识树的初始结构。第二步“往里塞”:将文档切分为512 token的片段,由LLM决定每块内容应归属哪个节点,可能合并进已有节点也可能新建子节点。过程中有两个关键控制参数:τ_text控制叶节点内容长度,超过阈值则自动分裂;τ_level控制同层节点数,过多时触发软聚类以保持树的结构平衡。第三步“回炉精炼”:完成所有片段插入后,自底向上整理内容并生成各节点摘要,使整棵树的语义表述更加清晰一致。整个构建过程由LLM驱动,实验中使用了Qwen2.5-72B模型。
知识树的构建机制
知识树构建完成后,在线检索流程模拟Agent“读书”的过程。步骤一为向量检索定位候选集,对查询在所有节点上做向量检索,拿到top-k候选后映射到对应的语义子树,将检索范围从整本书收敛到一两个相关章节。步骤二逐层节点选择,从子树顶层开始,每层让LLM挑选与查询最相关的节点集合。步骤三进行节点决策,对每个选中节点判断是吸收进最终上下文还是继续展开子节点,这个决策是迭代进行的,Agent可以根据已收集信息判断还缺什么。步骤四混合上下文生成答案,最终输出由向量检索片段、中间层摘要、按需展开的原始文本混合而成的上下文,交给生成模型作答。此外还提供了记忆增强版本,维护动态记忆状态让Agent对“已知道什么、还缺什么”有更全局的感知。
如有侵权,请联系删除。
Related Articles
-
Fri Jun 12 2026红杉领投种子轮融资,AI企业法务初创Sandstone又完成3000万美元A轮融资
AI法务初创Sandstone在短时间内完成新一轮融资,显示出资本对法务领域AI化的浓厚兴趣。公司通过模型与流程结合,为中小企业提供日常法务自动化解决方案。
-
Fri Jun 12 2026融资813亿,估值3000亿,这家AI公司创办仅一年
近日,一家由科技界重要人物秘密创立的AI公司完成了规模巨大的B轮融资,成为2026年迄今为止最引人注目的融资事件之一。公司专注将AI能力工程化,赋能复杂工业产品的设计与开发。
-
Fri Jun 12 2026AI生态之战打响:微信做入口,腾讯来托底
本文从微信的用户规模与生态能力切入,分析其作为AI入口的天然优势,及腾讯如何通过开放接入和生态联动,打造面向服务商与开发者的智能体接入体系。
-
Fri Jun 12 2026谷歌 847 亿融资释放信号,AI 进入回本大考
本文围绕Alphabet筹资847.5亿美元事件展开,分析该轮融资对AI产业资本逻辑与估值体系的深远影响,强调大规模投入对行业分化与资源配置的推动作用。
-
Fri Jun 12 2026明天见!AI焕新·智能相伴——PKPM Agent 2.0暨工程智能体"十五五"发展研讨会(北京站)
PKPM Agent 2.0在北京站研讨会亮相,会议围绕工程智能体在复杂结构分析、智能审查与城市更新中的实践展开讨论,强调智能体在工程设计与建造中的助力作用。
-
Thu Jun 11 2026资本加码!AI+芯片双赛道,新区企业跑出加速度
文章报道南京新区多家企业在AI与芯片赛道获得新一轮融资,揭示区域创新生态的活力与资金对接能力,体现资本对实体技术落地的支持。
-
Thu Jun 11 2026AniShort斩获近亿元融资,刷新AI短剧工具赛道融资纪录
AniShort是八点八数字推出的全流程一站式AI短剧协作平台,集成剧本创作、分镜生成、视频生成与智能剪辑等能力,旨在减少创作门槛并提升制作效率。
-
Wed Jun 10 20262026-2030年智能体市场发展趋势分析
2026-2030年,AI产业将从大模型应用时代全面迈入智能体规模化落地时代,应用范式朝向自主规划与闭环执行演进,带来新的市场结构与竞争格局。
-
Wed Jun 10 2026如何把握AI波动
行业分析认为2026年为智能体之年,整体景气度明确,资本与产业将围绕智能体生态和算力基础设施展开布局。
-
Wed Jun 10 2026知晓现在 洞见未来(20260610)
本文报道微信智能体将能调取小程序完成交易和服务,首批包括美团、滴滴、携程在内的企业接入内测,标志着智能体与现有移动生态的深度融合加速。
-
Wed Jun 10 202627亿,英伟达买下一个A轮AI团队
英伟达完成对 Kumo AI 的收购,交易金额折合约27亿元人民币,主要以人才并购形式整合团队与技术,显示出公司在软件与应用层面的积极布局。
-
Wed Jun 10 2026英伟达领投,AI科学实验室Lila Sciences拟融资20亿美元,估值85亿美元
Lila Sciences 正在推进一轮规模巨大的融资,目标金额约20亿美元,融资前估值接近85亿美元。本轮由英伟达等核心投资方领投,旨在为其基于AI的科学发现平台提供扩张资金。
-
Wed Jun 10 2026汇信科技入选《2026中国AI智能体领航者产业图谱》,“智服小联”获政务赛道标杆案例
汇信科技依托'智服小联'在政务年报场景中的实践,凭借全链条闭环监管能力入选《2026中国AI智能体领航者产业图谱》政务赛道标杆案例。
-
Wed Jun 10 2026医疗、制造与零售变天了:看这三大行业如何跨入AI转型年
金融服务、工业与医疗三大行业已率先迈入AI规模化落地阶段,凭借海量数据和成熟的数据基础设施,成为智能体应用的先行者。
-
Wed Jun 10 2026事关AI算力!工信部重磅发布
工信部印发《人工智能信息通信创新发展实施意见(2026—2028年)》,提出要在信息通信与人工智能领域实现更深度的融合,推动产业链上下游协同创新和场景化应用落地。
-
Wed Jun 10 2026金融AI智能体采购进入“爆发期”,苏州银行、宁波银行等机构已落地
2026年上半年,银行业智能体采购进入显著增长期,多家区域性银行发布智能体项目招标,覆盖开发平台与信贷全流程场景,推动金融科技从模型验证向大规模应用转变。
-
Wed Jun 10 2026Anthropic双模型腰斩上线、SpaceX获4倍认购、华为云500万Tokens/秒
近期科技与AI领域出现多重重磅事件:Anthropic发布面向开发者与高安全场景的两款新模型并下调定价,SpaceX的融资产品遭遇超额认购,华为云在算力优化上取得显著吞吐提升。
-
Wed Jun 10 2026为AI竞赛筹备弹药,腾讯发债融资315亿元
腾讯近期完成中期票据与人民币票据发行,总规模约315亿元,募集资金将用于加强AI基础设施与相关技术投入,以应对日益激烈的AI竞争环境。
