Karpathy原版 vs 我们的实现¶
结构差异¶
| 方面 | Karpathy原版 | 我们的实现 | 状态 |
|---|---|---|---|
| 三层结构 | raw/(不可变)→ wiki/(LLM拥有)→ output(可交付物) | raw/ → wiki/ → output/ | ✅ 已对齐 |
| raw/组织 | articles/、papers/、repos/、assets/ | articles/、papers/、assets/ | ✅ 已对齐 |
| wiki/页面 | 概念、实体、对比、概述、综合、摘要 | concepts/、entities/、comparisons/、topics/、sources/ | ✅ 已对齐 |
| Schema文件 | CLAUDE.md / AGENTS.md(顶层代理指令) | SCHEMA.md(项目根目录) | ✅ 已对齐 |
| overview.md | 单一综合叙事 | wiki/overview.md(5条故事线) | ✅ 已对齐 |
| index.md | 内容目录 | wiki/index.md(按类别组织) | ✅ 已对齐 |
| log.md | 仅追加日志 | wiki/log.md(可解析条目) | ✅ 已对齐 |
| topics/ | 原版无此文件夹(综合在overview.md中) | 跨来源主题综合 | ➕ 我们扩展的 |
| entities/ | 实体页面 | 实体页面 | ✅ 已对齐 |
操作对齐¶
| 操作 | Karpathy | 我们的SCHEMA.md | 状态 |
|---|---|---|---|
| Ingest | 放入raw/,LLM处理,更新wiki页面、index、log | 含post-ingest checklist的6步流程 | ✅ |
| Query | 搜索wiki,综合,将好的答案归档回wiki页面 | 记录的相同流程 | ✅ |
| Lint | 矛盾、孤立、过期声明的健康检查 | 健康检查 + 模式发现 | ✅ |
| Synthesize | 累积后发现涌现模式 | 5+来源后触发,保存到comparisons/topics | ✅ |
| 用户参与 | "我更喜欢一次处理一个并保持参与" | "和宇飞讨论要点" | ✅ |
| 每次ingest页面数 | "每个来源10-15个wiki页面" | post-ingest checklist确保下游更新 | ✅ |
关键哲学观点(Karpathy)¶
- "wiki是持久的、复合的工件。" — 交叉引用已存在,矛盾已标记,综合反映所有已读内容
- "你永远不要自己写wiki——LLM编写和维护全部" — 用户提供来源,LLM做苦力
- "Obsidian是IDE;LLM是程序员;wiki是代码库" — 开发隐喻
- "繁琐的部分不是阅读或思考——是簿记" — LLM不会厌倦,不会忘记交叉引用
我们缺少的(来自Karpathy的提示)¶
- ✗ Obsidian Web Clipper — 浏览器扩展 → raw/
- ✗ 图片下载流程 — 附件到raw/assets/
- ✗ Marp — markdown转幻灯片格式
- ✗ Dataview — Obsidian插件,用于frontmatter查询
- ✗ 图形视图 — 可视化wiki连接
- ✗ qmd — 本地markdown搜索引擎(BM25 + 向量 + LLM重排序)
我们添加的(超越Karpathy)¶
- ✅ post-ingest checklist — 强制检查5个下游文件夹(Karpathy未明确)
- ✅ topics/文件夹 — 跨来源主题综合(Karpathy的综合在overview.md中)
- ✅ SCHEMA.md — 中文版明确操作规范
- ✅ YAML frontmatter — 每个页面都有完整元数据
- ✅ Gitee镜像 — 国内可达的git远程仓库
相关内容¶
[[wiki/overview]]— 知识库总览