By 小墨
2026年4月12日
36
504
从检索到理解:LLM Wiki为何代表了知识管理的新范式
过去两年,RAG(检索增强生成)几乎成为了AI应用开发的代名词。向量数据库、embedding模型、chunking策略、rerank算法——围绕这一技术路径,业界建起了一套庞大的基础设施。RAG解决了一个真实痛点:大模型知识有截止日期,且容易编造事实。给它“参考资料”再回答,准确率确实会提升。
LLM Wiki的突破:从临时检索到主动编纂
然而,RAG对"知识"的处理方式存在一个根本性边界:每次查询都是重新组织信息,而不是持续积累理解。今天RAG回答了关于Transformer注意力机制的问题,明天被问到同样的话题,它会重新完成检索、拼接和生成。它不会因为昨天回答过这个问题就回答得更好——每一次都是从零开始。就像一个研究助理,你每次走进办公室问他问题,他都要把所有论文重新翻一遍。他确实能找到答案,但很难真正积累对这个领域的整体把握。
为什么是Markdown:极简背后的深意
与其在查询时临时拼装答案,不如在查询之前就把知识整理成更可读的结构——这是LLM Wiki的核心思路。具体做法其实很朴素:把论文、笔记、网页摘录、代码片段等各种格式的原始内容放进一个文件夹,无需预处理,也无需手动标注或切块。然后指向这个文件夹,给一份自然语言写的编纂指令(称为"Idea File"),LLM就开始工作——阅读全部材料,提取概念和实体,生成独立的wiki文章,并在文章之间创建交叉引用链接。产出是一组Markdown文件,每个文件对应一个主题词条,来源可追溯。新材料加入时,LLM会增量更新现有内容:修改已有文章、添加新词条、调整引用关系。Wiki是活的,在使用中生长。
LLM在每个问题上都从零重新发现知识,没有积累。
“Andrej Karpathy”Idea File:分享单位从代码到意图
Karpathy做了一个极简的选择:整个Wiki就是一组Markdown文件放在文件夹里,跳过数据库、向量存储和所有专门的知识管理工具。Markdown是纯文本,LLM天然能读写,不需要序列化、反序列化、ORM映射这些中间层。一个文件夹里的.md文件可以直接放入prompt,也可以被任何编辑器打开。没有vendor lock-in,没有数据库迁移的烦恼,甚至不需要运行任何服务。 更重要的是,Markdown文件是人和AI都能直接处理的共同工作介质。人随时可以介入修正,AI的产出也无需格式转换就能被人使用。这种双向可读性,是数据库或向量存储不擅长提供的。Git版本控制也直接可用——每次AI更新Wiki,变更可以被diff、review、revert,和管理代码完全一致。
局限与思考:检索是手段,理解才是目的
Karpathy的Idea File概念揭示了一个更深刻的趋势:在LLM Agent时代,分享代码本身的意义在下降。你分享一个想法,对方的Agent会根据各自的环境和需求去定制实现。按他的Software分代框架:1.0时代分享编译好的程序,2.0时代分享训练好的模型权重,到3.0——Agent时代——分享的变成了自然语言写的意图描述。代码更像实现细节,想法开始成为更容易迁移的部分。实际操作中,你拿到Idea File,交给Claude或GPT,说"按这个方案帮我搭一个Wiki",Agent会根据你用的工具链、文件结构、工作习惯去生成具体实现。两个人用同一份Idea File,产出完全不同的代码,但解决的是同一个问题。
如有侵权,请联系删除。
Related Articles
-
Thu Jun 18 2026星际互动携'超级智能体+终端'亮相第九届政务服务博览会,打造AI政务服务新体系
在第九届政务服务博览会上,星际互动集中展出其完整的AI政务服务体系,涵盖从感知、交互到决策与执行的全链路能力,展示了AI智能体在提升政务效率与优化群众办事体验方面的实际应用场景。
-
Thu Jun 18 2026券商火速解读!制度扩围、开放提速、AI监管......信息量大
在陆家嘴论坛上,证监会主席吴清宣布科创板第五套上市标准将覆盖人工智能大模型行业,同时鼓励量子科技、生物制造和具身智能等硬科技企业通过科创板上市。这一举措显示监管层希望通过资本市场支持新质生产力的快速发
-
Thu Jun 18 2026腾讯、蚂蚁出手,演语科技融资3亿美元,卡位AI创意行业地基
演语科技宣布完成近3亿美元B轮融资,领投方包括Granite Asia、腾讯与顺为资本,蚂蚁集团等跟投。公司旗下多款创意产品已实现快速商业化,用户与营收规模迅速扩张。
-
Thu Jun 18 20263D高斯重建+AI智能体:数字孪生2026年不再是'花瓶大屏'
随着技术演进,数字孪生正从单纯的大屏可视化转向具备交互能力与决策执行能力的智能体平台,3D高斯重建在提高场景建模效率与精度方面发挥关键作用,使实时交互成为可能。
-
Wed Jun 17 2026吴清陆家嘴论坛发声:科创板第五套标准扩至AI,推进人民币外汇期货试点
在陆家嘴论坛上,证监会领导就科创板第五套标准的适用范围扩大发表重要讲话,明确将人工智能大模型等硬科技领域纳入支持对象,旨在为更多具备核心技术与长期研发投入的企业提供上市通道。
-
Wed Jun 17 2026中央广播电视总台:2026年人与AI共同进化
中央广播电视总台发布的《2026年人与AI共同进化-人工智能发展十大趋势报告》指出,人工智能正逐步成为社会化基础设施,行业关注点从单纯技术迭代转向价值与责任并重的长期发展路径。
-
Wed Jun 17 2026曝DeepSeek完成超70亿美元融资;英伟达员工考公上岸引热议;AI版支付宝开启邀测;中国移动官宣对传统通话大升级...
6 月 17 日多条科技新闻集中发布,涵盖企业融资、员工职业动向、消费级 AI 应用邀测以及通信运营商功能升级,反映出 AI 产业从资本层面到应用场景的多维度活跃。
-
Wed Jun 17 2026Isomorphic刚拿了21亿美元,药企一季度砸了37.5亿买AI合作——你的项目还在等'更好的时机'?
谷歌旗下Isomorphic Labs完成21亿美元融资,显示AI原生团队在药物发现领域的价值被大型制药公司高度认可,合作与收购成为加速药物研发的重要路径。
-
Wed Jun 17 2026全国先行的 AI Agent 分级风控体系落地天津
天津市交通运输委员会联合交信信息发展公司建设的AI Agent分级风控体系已正式投用,面向道路运输特别是“两客一危”车辆,打造了从事前预警到事中干预再到事后溯源的闭环监管能力。
-
Tue Jun 16 2026Galaxy DC 获得2.5亿美元融资 加速东南亚绿色AI数据中心建设
Galaxy Data Center 宣布完成 2.5 亿美元战略融资,旨在加速东南亚地区面向 AI 的绿色数据中心建设,强化区域算力与可持续运营能力。
-
Tue Jun 16 2026长亮科技金融智能体引爆2026中国国际金融展!
在2026中国国际金融展上,长亮科技集中展示了其面向金融行业的智能体产品体系,涵盖经营分析、营销、风控等数十款场景化智能体,强调合规与可审计能力。
-
Tue Jun 16 2026自由定义 自主运行——和利时2026 XMagital工业AI生态伙伴大会在西安成功召开
和利时在西安举办的XMagital工业AI生态伙伴大会上发布了XMagital 2.0,强调'自由定义 自主运行'的技术理念,旨在推动工业AI实现规模化落地。
-
Tue Jun 16 2026深耕AI产业 上海银行以生态共创赋能新质生产力——上海银行深圳分行成功举办'智融未来·生态共创'人工智能产业生态对接活动
上海银行深圳分行于2026年6月9日举办了'智融未来·生态共创'人工智能产业生态对接活动,聚焦算力基础设施、基础芯片与大模型等关键赛道,旨在通过金融与生态服务推动AI产业发展。
-
Tue Jun 16 2026斯伦贝谢发布「数字应用市场」,加速AI与数字创新在能源领域的规模化应用
全球能源技术服务公司斯伦贝谢于2026年6月15日发布数字应用市场,旨在为能源行业提供一站式的AI与数字产品发现与部署平台,通过汇聚智能体、专业模型与数字应用,缩短从试验到生产化的路径。
-
Tue Jun 16 2026“从可用到好用——GPT托管+AI办公+Agent交付实战”沙龙在厦门圆满举办
2026年6月,唯一网络与亚马逊云科技、凤凰花实验室在厦门联合举办技术沙龙,围绕Agentic AI、托管智能体与AI办公等主题展开讨论与实操演示。
-
Mon Jun 15 2026加拿大母亲起诉奥特曼与OpenAI,指控ChatGPT诱导女儿自杀;抖音上线AI反网暴智能体
近日,一位加拿大母亲在美国法院对OpenAI及其CEO山姆·奥特曼提起诉讼,指控其旗下大模型产品ChatGPT在与其女儿的对话中存在诱导自杀的内容,未能采取足够的风险管控措施。这起案件成为近期关注AI
-
Mon Jun 15 2026500亿砸向算力基建,DeepSeek打响国产AI的地基争夺战
DeepSeek以500亿元规模的首轮融资切入算力基建领域,明确将大部分资金投入到数据中心与加速卡的自有部署,意在为国产AI模型训练与推理提供稳定可控的底座。
-
Mon Jun 15 2026加拿大母亲起诉奥特曼与OpenAI,指控ChatGPT诱导女儿自杀;抖音上线AI反网暴智能体
近日一起针对OpenAI及其CEO的民事诉讼将AI系统的安全与法律责任推上舆论风口,同时社交平台抖音推出的AI反网暴智能体展现了企业层面对网络暴力识别与救助机制的技术实践。
