2026年4月6日

380

构建个人AI知识库：Karpathy同款方案的完整实践指南

在信息爆炸的时代，如何高效管理和利用个人积累的知识资源成为一道难题。知名AI研究者Karpathy近日分享了他使用大模型构建个人知识库的方法，引发广泛关注。这位曾任特斯拉Autopilot负责人的技术大咖表示，他最近的大部分Token使用量都用于处理内容而非编写代码。这一转变背后，是对知识管理模式的深刻反思：将分散在各处的笔记和资料统一整合，让AI协助整理、关联和提炼，从而形成真正有用的个人知识库。

第一步：创建基础的文件夹架构

传统知识管理工具往往需要用户花费大量时间进行分类和整理，而这套方案的核心思路恰恰相反：不要把笔记分散在各种应用中，全部扔进一个文件夹，然后让AI自动完成后续的整理工作。听起来简单？但效果惊人——你的知识库会随着使用越来越好用。

第二步：让AI成为你的“整理师”

整个系统只需要三个文件夹就能运行。在电脑上任意位置创建一个项目文件夹，在其中建立三个子文件夹：raw/目录用于存放原始素材（文章、笔记、截图等），wiki/目录是AI写入整理后内容的地方，outputs/目录则存放AI生成的答案、报告和研究结果。这个结构看似简单，却暗含深意：raw文件夹是纯粹的素材收纳箱，AI只读不写；wiki是AI的“作品间”，由AI全权维护；outputs则是你与AI互动的产出存放处。三者各司其职，构成了知识库的物理基础。

我试图保持超级简单和扁平。它只是一个嵌套的.md文件目录。

“Karpathy”

第三步：自动化抓取网页内容

建立好文件夹后，接下来要做的就是往raw/文件夹里塞东西。关键原则是：什么都往里扔，别整理、别重命名、别清理。把文章复制粘贴成.md或.txt文件，截图和图表直接保存，从现有应用里导出笔记、会议记录、研究论文、项目文档，甚至那些囤了几个月的书签，统统扔进去。你需要做的只是“扔”，整理工作全部交给AI。Karpathy本人也承认，他做研究时攒了17个原始文件——剪藏的文章、竞品分析、数据报告，没有一个是手工整理的。但真正加速这个过程的是自动化收集。Vercel Labs发布的agent-browser工具让AI Agent可以直接操控Chrome浏览器抓取网页内容。安装后，只需两条命令就能让AI打开任意网页、提取文本并保存到raw/文件夹。这个工具特别擅长处理那些手动复制粘贴难以搞定的情况：JavaScript动态加载的网站、需要登录才能查看的内容、带交互式图表的研究论文，以及需要不停滚动才能看到完整内容的页面。相比同类工具，它能节省82%的Token消耗，这意味着同一轮对话中AI能抓取5到6倍的页面。

第四步：给AI一份“说明书”

在项目根目录创建一个CLAUDE.md文件（也可用AGENTS.md或README.md），这是给AI写的专属说明书，让它知道知识库的组织规则。文件需要包含以下核心内容：说明这是什么类型的知识库，定义三个文件夹各自的职责，制定wiki的编写规则（如每个主题独立文件、以摘要开头、使用特定格式链接相关主题、维护INDEX索引文件），以及列出你希望知识库关注的兴趣方向。 Karpathy本人形容他的schema“超级简单，完全扁平”：没有数据库，没有插件，只是一个告诉AI规则的文本文件。这个文件就是你给AI的“工作手册”，决定了后续所有整理工作的质量。

如有侵权，请联系删除。

AI知识库 RAG技术大模型应用个人提效积墨AI AI智能体 AI智能体平台私有化AI智能体平台企业级AI智能体

Share This Post

构建个人AI知识库：Karpathy同款方案的完整实践指南

第一步：创建基础的文件夹架构

第二步：让AI成为你的“整理师”

第三步：自动化抓取网页内容

第四步：给AI一份“说明书”

Popular Articles

企业级AI智能体如何突破效率孤岛，实现价值共振？

阿里通义Qwen模组：一周三次开源造势

积墨AI 7月更新日志

Related Articles

【AI】Agent落地、千亿募资与算力军备：AI正在经历一场'去泡沫化'战争

AI+介入机器人：'智能协同'定义介入诊疗新趋势

反超OpenAI！Anthropic登顶全球最贵AI公司

从代码生成到智能体协同：源启双引擎重构企业AI落地新范式

智王AI量化智能体，五月封神：AGI在资本市场的初代力量

博泰车联：与英伟达举行战略合作签约仪式，双方围绕车载AI、自动驾驶、下一代计算平台及光通信等进行探讨

2026新政解读:智能体与AI终端的'双向奔赴',AIoT产业迎来三大价值重构

芮勇主讲：AI智能体的最新进展、挑战和机会

2026全球AI算力报告及算力产业十大趋势重磅发布

AI Open Day兰州龙虾大会圆满举办，共绘西北数字经济新蓝图

谷歌AI垂直整合战略，全世界都在静静观察

2026全球AI与Agent的演进与落地

Agent爆发周期，思格新能源画出了'AI+光储'时代的新坐标

AI编程Cognition融资超10亿美元，估值260亿美元，ARR 4.92亿美元

AI推理服务商Fireworks AI拟定新一轮融资，估值150亿美元

软银主导国产AI联盟又吸引15家公司投资

别在CVPR独自社恐了！来丹佛AI Talent Meetup，只聊你听得懂的技术与理想

临床试验革命！神经AI平台横空出世，FDA实时审查新政迎来首个落地者

构建个人AI知识库：Karpathy同款方案的完整实践指南

第一步：创建基础的文件夹架构

第二步：让AI成为你的“整理师”

第三步：自动化抓取网页内容

第四步：给AI一份“说明书”

Popular Articles

企业级AI智能体如何突破效率孤岛，实现价值共振？

阿里通义Qwen模组：一周三次开源造势

积墨AI 7月更新日志

Related Articles

【AI】Agent落地、千亿募资与算力军备：AI正在经历一场'去泡沫化'战争

AI+介入机器人：'智能协同'定义介入诊疗新趋势

反超OpenAI！Anthropic登顶全球最贵AI公司

从代码生成到智能体协同：源启双引擎重构企业AI落地新范式

智王AI量化智能体，五月封神 ：AGI在资本市场的初代力量

博泰车联：与英伟达举行战略合作签约仪式，双方围绕车载AI、自动驾驶、下一代计算平台及光通信等进行探讨

2026新政解读:智能体与AI终端的'双向奔赴',AIoT产业迎来三大价值重构

芮勇主讲：AI智能体的最新进展、挑战和机会

2026全球AI算力报告及算力产业十大趋势重磅发布

AI Open Day兰州龙虾大会圆满举办，共绘西北数字经济新蓝图

谷歌AI垂直整合战略，全世界都在静静观察

2026全球AI与Agent的演进与落地

Agent爆发周期，思格新能源画出了'AI+光储'时代的新坐标

AI编程Cognition融资超10亿美元，估值260亿美元，ARR 4.92亿美元

AI推理服务商Fireworks AI拟定新一轮融资，估值150亿美元

软银主导国产AI联盟又吸引15家公司投资

别在CVPR独自社恐了！来丹佛AI Talent Meetup，只聊你听得懂的技术与理想

临床试验革命！神经AI平台横空出世，FDA实时审查新政迎来首个落地者

智王AI量化智能体，五月封神：AGI在资本市场的初代力量