Karpathy LLM Wiki：用 AI 建一个会自动生长的第二大脑

Author： loujohn
发布时间：June 30, 2026
13 views
No comments
4869 words
Categories： AI工具知识管理

Karpathy LLM Wiki：用 AI 建一个会自动生长的第二大脑

你问 AI 一百个问题，知识归零一百次。Karpathy 说：换个玩法——让 AI 替你持续编译一本百科全书，问得越多，它越聪明，知识永远不归零。

这不是又一个「Obsidian 搭建教程」

先说清楚：这篇文章不是教你怎么用 Obsidian 做笔记、怎么整理 PARA、怎么挑插件。那些话题网上已经写得够多了。

我要讲的是一种完全不同的知识生产方式——

让 LLM 当「编译器」，把你的原始资料增量编译成一本结构化、互相链接的 Markdown 百科全书。

这个想法来自 Andrej Karpathy。2025 年 4 月，他在 GitHub Gist 上发了一篇不到 500 字的短文，标题叫 LLM Wiki。没有代码，没有工具推荐，只是一个思路：

与其每次提问都让 AI 从原始文档里重新检索、重新拼答案（RAG 的老路子），不如让 AI 把知识预先编译成一本 wiki。交叉引用已经建好，矛盾已经标注，综合结论已经反映了所有已读过的资料。

这条 gist 拿到了 55K 点赞，30 多个开源实现紧随其后。

为什么一个「让 AI 写 wiki」的想法能引爆全网？因为它戳中了一个每个人都在忍受的痛点——

你剪藏了 500 篇文章，一篇也没看过。你问 AI 同一个问题，它每次给你不同答案。你的知识从来没有在「积累」，只是在「循环」。

LLM Wiki 要解决的就是这件事。

一、为什么不是 RAG？——「增量编译」vs「每次重做」

RAG 的问题

大多数人用 AI 处理知识的方式，本质上都是 RAG（Retrieval-Augmented Generation，检索增强生成）：

上传文件 / 丢链接
AI 把文档切成碎片（chunks）
你提问时，AI 从碎片里检索出相关的几段
拼成一个答案给你
结束。下次再问，从头来。

NotebookLM 是这样，ChatGPT 的文件上传是这样，绝大多数「AI 知识库」产品都是这样。

问题在哪？没有积累。

你问了一个好问题，AI 花了一堆 token 检索、推理、综合，给出了一个精彩的回答——然后这个回答就消失了。下次你或者别人问类似的问题，同样的检索、同样的推理、同样的 token 消耗，一切从零开始。

这就像每次做菜都从买菜开始。

LLM Wiki 的核心差异

Karpathy 的方案完全不同：

知识被编译一次，然后持续维护，不是每次查询重新推导。

打个比方：你有一个助手，不只是帮你做菜——他会帮你备菜、切好、分装、贴标签。下次做菜的时候，直接打开冰箱拿就行。如果来了新食材，他会更新冰箱里的分类，而不是把所有菜都倒掉重来。

这就是「增量编译」：

新资料进来 → LLM 读取它
LLM 对比已有的 wiki 页面
更新已有页面（加入新信息、补充细节）
创建新页面（如果有全新概念）
建立交叉引用（双向链接）
标注矛盾（A 页面说 X，B 页面说 Y，但两者冲突）
更新索引和日志

知识是编译进去的，不是检索出来的。

这两者的区别，用一个表格说清楚：

维度	RAG（每次重做）	LLM Wiki（增量编译）
知识处理时机	查询时实时检索	摄入时预先编译
知识形态	原始文档碎片	结构化 wiki 页面
交叉引用	每次查询重新发现	已预先建立
矛盾处理	可能返回冲突信息	已标注并待审核
更新方式	追加文档到向量库	增量更新已有页面
人工介入	较少（自动索引）	较多（审核编译结果）
知识积累	无（每次从零开始）	有（雪球越滚越大）

一句话总结：RAG 是「每次现查现答」，LLM Wiki 是「持续编译、越用越厚」。

二、Karpathy 的三层架构

Karpathy 在 gist 里描述了一个简洁的三层结构。理解这三层，就理解了 LLM Wiki 的全部骨架：

┌─────────────────────────────────┐
│  Schema 层（规则）               │  ← CLAUDE.md / SYSTEM.md
│  告诉 LLM 怎么组织 wiki          │
├─────────────────────────────────┤
│  Wiki 层（编译产物）              │  ← 你的「第二大脑」
│  概念文章、实体页面、索引、链接    │
├─────────────────────────────────┤
│  Raw 层（原始资料）               │  ← 等待编译的原料
│  文章、论文、播客笔记、网页剪藏    │
└─────────────────────────────────┘

Schema 层：规则书

一个 Markdown 文件（通常叫 CLAUDE.md 或 SCHEMA.md），告诉 LLM：

目录结构怎么组织
文件怎么命名
链接格式是什么
什么时候创建新页面、什么时候更新已有页面
遇到矛盾信息怎么处理

这是整个系统的「宪法」。 LLM 每次操作前都会读它，确保编译出来的一致性。

Wiki 层：你的百科全书

这是 LLM 编译出来的产物——一堆结构化的 Markdown 文件：

concepts/ — 概念页面（如「AI Agent」「个人知识管理」）
entities/ — 实体页面（如「Obsidian」「Claude Code」）
comparisons/ — 对比页面（如「RAG vs LLM Wiki」）
index.md — 目录索引
log.md — 操作日志

每个页面都有 YAML frontmatter（标题、创建日期、更新日期、来源、置信度等），页面之间用 [[wikilinks]] 互相链接。

Raw 层：等待编译的原料

你收集的所有原始资料放在这里：

raw/articles/ — 文章、博客
raw/papers/ — 论文 PDF
raw/notes/ — 播客笔记、会议记录
raw/bookmarks/ — 网页剪藏

Raw 层的东西不是知识，是知识的原料。 只有经过 LLM 编译进入 Wiki 层，才算真正变成了你的知识资产。

Karpathy 自己说：「Obsidian 是 IDE；LLM 是程序员；Wiki 是代码库。」

三、30 分钟搭起来：环境准备与最小复刻

你需要什么

Obsidian（任意版本，免费）—— 用来浏览和可视化 wiki
Claude Code CLI（或其他能操作本地文件的 LLM agent）—— 用来编译知识
终端（macOS Terminal / iTerm / Windows Terminal）

⚠️ 重要区分： 这里用 Obsidian 不是因为它有什么「AI 功能」，而是因为它是一个纯粹的 Markdown 文件浏览器。LLM 写入文件，Obsidian 实时显示。不需要插件，不需要配置，不需要向量数据库。这和普通 Obsidian 知识库搭建完全不同——那篇文章讲的是「人怎么整理笔记」，这篇讲的是「AI 怎么编译知识」。

步骤 1：创建 Vault 目录

mkdir -p ~/llm-wiki
cd ~/llm-wiki

# 创建三层结构
mkdir -p raw/articles raw/papers raw/notes
mkdir -p wiki/concepts wiki/entities wiki/comparisons wiki/queries

步骤 2：写 Schema 文件

在 vault 根目录创建 SCHEMA.md：

# Wiki Schema

## Domain
[你的知识库主题，比如：AI 技术与个人知识管理]

## Conventions
- 文件名：小写、连字符、无空格（如 ai-agent.md）
- 每个 wiki 页面以 YAML frontmatter 开头
- 使用 [[wikilinks]] 链接页面（每页至少 2 个外链）
- 更新页面时，必须更新 frontmatter 中的 updated 日期
- 新页面必须加入 index.md
- 每次操作必须追加到 log.md
- 来源标注：在段落末尾添加 ^[raw/articles/文件名.md]

## Frontmatter 模板
---
title: 页面标题
created: YYYY-MM-DD
updated: YYYY-MM-DD
type: entity | concept | comparison | query
tags: [标签1, 标签2]
sources: [raw/articles/来源文件.md]
confidence: high | medium | low
---

## 页面规则
- 一个概念在 2+ 来源中出现 → 创建独立页面
- 一个来源提到了已有概念 → 更新已有页面
- 只是顺带提到 → 不创建页面
- 页面超过 200 行 → 考虑拆分

## 矛盾处理
当新信息与已有内容冲突时：
1. 检查日期——新来源通常优先
2. 如果确实矛盾，在两个页面都标注两种观点
3. 在 frontmatter 中标记：contradictions: [页面名]
4. 在日志中标注待审核

步骤 3：初始化索引和日志

创建 index.md：

# Wiki Index

> Last updated: [今天日期] | Total pages: 0

## Entities
（暂无）

## Concepts
（暂无）

## Comparisons
（暂无）

## Queries
（暂无）

创建 log.md：

# Wiki Log

> 所有操作的 chronological 记录。仅追加。

## [今天日期] create | Wiki initialized
- Structure created with SCHEMA.md, index.md, log.md
- Ready for first ingestion

步骤 4：在 Obsidian 中打开

打开 Obsidian
选择「Open folder as vault」
选择 ~/llm-wiki 目录
你会看到左侧文件树

**

Last modification：June 30, 2026

如果觉得我的文章对你有用，请随意赞赏

Karpathy LLM Wiki：用 AI 建一个会自动生长的第二大脑

loujohn • 2026 年 06 月 30 日

<p><img src="https://blog.fishliu.com/usr/themes/handsome/assets/img/loading.svg" alt="cover" title="cover" style=""data-original="https://blog.fishliu.com/usr/uploads/2026/06/915035616.png"></p><h1>Karpathy LLM Wiki：用 AI 建一个会自动生长的第二大脑</h1><blockquote>你问 AI 一百个问题，知识归零一百次。Karpathy 说：换个玩法——让 AI 替你持续编译一本百科全书，问得越多，它越聪明，知识永远不归零。</blockquote><hr><h2>这不是又一个「Obsidian 搭建教程」</h2><p>先说清楚：这篇文章<strong>不是</strong>教你怎么用 Obsidian 做笔记、怎么整理 PARA、怎么挑插件。那些话题网上已经写得够多了。</p><p>我要讲的是一种完全不同的知识生产方式——</p><p><strong>让 LLM 当「编译器」，把你的原始资料增量编译成一本结构化、互相链接的 Markdown 百科全书。</strong></p><p>这个想法来自 Andrej Karpathy。2025 年 4 月，他在 GitHub Gist 上发了一篇不到 500 字的短文，标题叫 <em>LLM Wiki</em>。没有代码，没有工具推荐，只是一个思路：</p><blockquote>与其每次提问都让 AI 从原始文档里重新检索、重新拼答案（RAG 的老路子），不如让 AI 把知识<strong>预先编译</strong>成一本 wiki。交叉引用已经建好，矛盾已经标注，综合结论已经反映了所有已读过的资料。</blockquote><p>这条 gist 拿到了 55K 点赞，30 多个开源实现紧随其后。</p><p>为什么一个「让 AI 写 wiki」的想法能引爆全网？因为它戳中了一个每个人都在忍受的痛点——</p><p><strong>你剪藏了 500 篇文章，一篇也没看过。你问 AI 同一个问题，它每次给你不同答案。你的知识从来没有在「积累」，只是在「循环」。</strong></p><p>LLM Wiki 要解决的就是这件事。</p><hr><h2>一、为什么不是 RAG？——「增量编译」vs「每次重做」</h2><h3>RAG 的问题</h3><p>大多数人用 AI 处理知识的方式，本质上都是 RAG（Retrieval-Augmented Generation，检索增强生成）：</p><ol><li>上传文件 / 丢链接</li><li>AI 把文档切成碎片（chunks）</li><li>你提问时，AI 从碎片里检索出相关的几段</li><li>拼成一个答案给你</li><li>结束。下次再问，从头来。</li></ol><p>NotebookLM 是这样，ChatGPT 的文件上传是这样，绝大多数「AI 知识库」产品都是这样。</p><p><strong>问题在哪？没有积累。</strong></p><p>你问了一个好问题，AI 花了一堆 token 检索、推理、综合，给出了一个精彩的回答——然后这个回答就消失了。下次你或者别人问类似的问题，同样的检索、同样的推理、同样的 token 消耗，一切从零开始。</p><p>这就像每次做菜都从买菜开始。</p><h3>LLM Wiki 的核心差异</h3><p>Karpathy 的方案完全不同：</p><p><strong>知识被编译一次，然后持续维护，不是每次查询重新推导。</strong></p><p>打个比方：你有一个助手，不只是帮你做菜——他会帮你备菜、切好、分装、贴标签。下次做菜的时候，直接打开冰箱拿就行。如果来了新食材，他会更新冰箱里的分类，而不是把所有菜都倒掉重来。</p><p>这就是「增量编译」：</p><ul><li>新资料进来 → LLM <strong>读取</strong>它</li><li>LLM <strong>对比</strong>已有的 wiki 页面</li><li><strong>更新</strong>已有页面（加入新信息、补充细节）</li><li><strong>创建</strong>新页面（如果有全新概念）</li><li><strong>建立</strong>交叉引用（双向链接）</li><li><strong>标注</strong>矛盾（A 页面说 X，B 页面说 Y，但两者冲突）</li><li><strong>更新</strong>索引和日志</li></ul><p>知识是<strong>编译进去</strong>的，不是<strong>检索出来</strong>的。</p><p>这两者的区别，用一个表格说清楚：</p><table><thead><tr><th>维度</th><th>RAG（每次重做）</th><th>LLM Wiki（增量编译）</th></tr></thead><tbody><tr><td>知识处理时机</td><td>查询时实时检索</td><td>摄入时预先编译</td></tr><tr><td>知识形态</td><td>原始文档碎片</td><td>结构化 wiki 页面</td></tr><tr><td>交叉引用</td><td>每次查询重新发现</td><td>已预先建立</td></tr><tr><td>矛盾处理</td><td>可能返回冲突信息</td><td>已标注并待审核</td></tr><tr><td>更新方式</td><td>追加文档到向量库</td><td>增量更新已有页面</td></tr><tr><td>人工介入</td><td>较少（自动索引）</td><td>较多（审核编译结果）</td></tr><tr><td>知识积累</td><td>无（每次从零开始）</td><td>有（雪球越滚越大）</td></tr></tbody></table><p><strong>一句话总结：RAG 是「每次现查现答」，LLM Wiki 是「持续编译、越用越厚」。</strong></p><hr><h2>二、Karpathy 的三层架构</h2><p>Karpathy 在 gist 里描述了一个简洁的三层结构。理解这三层，就理解了 LLM Wiki 的全部骨架：</p><pre><code>┌─────────────────────────────────┐
│  Schema 层（规则）               │  ← CLAUDE.md / SYSTEM.md
│  告诉 LLM 怎么组织 wiki          │
├─────────────────────────────────┤
│  Wiki 层（编译产物）              │  ← 你的「第二大脑」
│  概念文章、实体页面、索引、链接    │
├─────────────────────────────────┤
│  Raw 层（原始资料）               │  ← 等待编译的原料
│  文章、论文、播客笔记、网页剪藏    │
└─────────────────────────────────┘</code></pre><h3>Schema 层：规则书</h3><p>一个 Markdown 文件（通常叫 <code>CLAUDE.md</code> 或 <code>SCHEMA.md</code>），告诉 LLM：</p><ul><li>目录结构怎么组织</li><li>文件怎么命名</li><li>链接格式是什么</li><li>什么时候创建新页面、什么时候更新已有页面</li><li>遇到矛盾信息怎么处理</li></ul><p><strong>这是整个系统的「宪法」。</strong> LLM 每次操作前都会读它，确保编译出来的一致性。</p><h3>Wiki 层：你的百科全书</h3><p>这是 LLM 编译出来的产物——一堆结构化的 Markdown 文件：</p><ul><li><code>concepts/</code> — 概念页面（如「AI Agent」「个人知识管理」）</li><li><code>entities/</code> — 实体页面（如「Obsidian」「Claude Code」）</li><li><code>comparisons/</code> — 对比页面（如「RAG vs LLM Wiki」）</li><li><code>index.md</code> — 目录索引</li><li><code>log.md</code> — 操作日志</li></ul><p>每个页面都有 YAML frontmatter（标题、创建日期、更新日期、来源、置信度等），页面之间用 <code>[[wikilinks]]</code> 互相链接。</p><h3>Raw 层：等待编译的原料</h3><p>你收集的所有原始资料放在这里：</p><ul><li><code>raw/articles/</code> — 文章、博客</li><li><code>raw/papers/</code> — 论文 PDF</li><li><code>raw/notes/</code> — 播客笔记、会议记录</li><li><code>raw/bookmarks/</code> — 网页剪藏</li></ul><p><strong>Raw 层的东西不是知识，是知识的原料。</strong> 只有经过 LLM 编译进入 Wiki 层，才算真正变成了你的知识资产。</p><p>Karpathy 自己说：「Obsidian 是 IDE；LLM 是程序员；Wiki 是代码库。」</p><hr><h2>三、30 分钟搭起来：环境准备与最小复刻</h2><h3>你需要什么</h3><ul><li><strong>Obsidian</strong>（任意版本，免费）—— 用来浏览和可视化 wiki</li><li><strong>Claude Code CLI</strong>（或其他能操作本地文件的 LLM agent）—— 用来编译知识</li><li><strong>终端</strong>（macOS Terminal / iTerm / Windows Terminal）</li></ul><blockquote><strong>⚠️ 重要区分：</strong> 这里用 Obsidian 不是因为它有什么「AI 功能」，而是因为它是一个纯粹的 Markdown 文件浏览器。LLM 写入文件，Obsidian 实时显示。不需要插件，不需要配置，不需要向量数据库。这和普通 Obsidian 知识库搭建完全不同——那篇文章讲的是「人怎么整理笔记」，这篇讲的是「AI 怎么编译知识」。</blockquote><h3>步骤 1：创建 Vault 目录</h3><pre><code class="lang-bash">mkdir -p ~/llm-wiki
cd ~/llm-wiki

# 创建三层结构
mkdir -p raw/articles raw/papers raw/notes
mkdir -p wiki/concepts wiki/entities wiki/comparisons wiki/queries</code></pre><h3>步骤 2：写 Schema 文件</h3><p>在 vault 根目录创建 <code>SCHEMA.md</code>：</p><pre><code class="lang-markdown"># Wiki Schema

## Domain
[你的知识库主题，比如：AI 技术与个人知识管理]

## Conventions
- 文件名：小写、连字符、无空格（如 ai-agent.md）
- 每个 wiki 页面以 YAML frontmatter 开头
- 使用 [[wikilinks]] 链接页面（每页至少 2 个外链）
- 更新页面时，必须更新 frontmatter 中的 updated 日期
- 新页面必须加入 index.md
- 每次操作必须追加到 log.md
- 来源标注：在段落末尾添加 ^[raw/articles/文件名.md]

## 页面规则
- 一个概念在 2+ 来源中出现 → 创建独立页面
- 一个来源提到了已有概念 → 更新已有页面
- 只是顺带提到 → 不创建页面
- 页面超过 200 行 → 考虑拆分

## 矛盾处理
当新信息与已有内容冲突时：
1. 检查日期——新来源通常优先
2. 如果确实矛盾，在两个页面都标注两种观点
3. 在 frontmatter 中标记：contradictions: [页面名]
4. 在日志中标注待审核</code></pre><h3>步骤 3：初始化索引和日志</h3><p>创建 <code>index.md</code>：</p><pre><code class="lang-markdown"># Wiki Index

&gt; Last updated: [今天日期] | Total pages: 0

## Entities
（暂无）

## Concepts
（暂无）

## Comparisons
（暂无）

## Queries
（暂无）</code></pre><p>创建 <code>log.md</code>：</p><pre><code class="lang-markdown"># Wiki Log

&gt; 所有操作的 chronological 记录。仅追加。

## [今天日期] create | Wiki initialized
- Structure created with SCHEMA.md, index.md, log.md
- Ready for first ingestion</code></pre><h3>步骤 4：在 Obsidian 中打开</h3><ol><li>打开 Obsidian</li><li>选择「Open folder as vault」</li><li>选择 <code>~/llm-wiki</code> 目录</li><li>你会看到左侧文件树</li></ol><blockquote>**</blockquote>

Karpathy LLM Wiki：用 AI 建一个会自动生长的第二大脑

Karpathy LLM Wiki：用 AI 建一个会自动生长的第二大脑

这不是又一个「Obsidian 搭建教程」

一、为什么不是 RAG？——「增量编译」vs「每次重做」

RAG 的问题

LLM Wiki 的核心差异

二、Karpathy 的三层架构

Schema 层：规则书

Wiki 层：你的百科全书

Raw 层：等待编译的原料

三、30 分钟搭起来：环境准备与最小复刻

你需要什么

步骤 1：创建 Vault 目录

步骤 2：写 Schema 文件

步骤 3：初始化索引和日志

步骤 4：在 Obsidian 中打开

Leave a Comment Cancel reply
使用cookie技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款

记一次nginx重复设置跨域解决

前端开发环境搭建指南

聊一聊前端组件开发思路

VPS新机配置

Linux 服务器常用命令记录

JavaScript 异步编程入门

OpenHands技术架构解析 + 本地部署复刻指南：从原理到跑通一个Bug修复

小红书算法2026底层转向：为什么收藏率比点赞更值钱

gitlab仓库自动同步到github

Karpathy LLM Wiki：用 AI 建一个会自动生长的第二大脑

Karpathy LLM Wiki：用 AI 建一个会自动生长的第二大脑

Karpathy LLM Wiki：用 AI 建一个会自动生长的第二大脑

这不是又一个「Obsidian 搭建教程」

一、为什么不是 RAG？——「增量编译」vs「每次重做」

RAG 的问题

LLM Wiki 的核心差异

二、Karpathy 的三层架构

Schema 层：规则书

Wiki 层：你的百科全书

Raw 层：等待编译的原料

三、30 分钟搭起来：环境准备与最小复刻

你需要什么

步骤 1：创建 Vault 目录

步骤 2：写 Schema 文件

步骤 3：初始化索引和日志

步骤 4：在 Obsidian 中打开

Leave a Comment Cancel reply 使用cookie技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款

Karpathy LLM Wiki：用 AI 建一个会自动生长的第二大脑

Leave a Comment Cancel reply
使用cookie技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款