Codex × LLM Wiki：在 Obsidian 中搭建 AI 知識庫

約 1092 字大約 4 分鐘

Codex × LLM Wiki：在 Obsidian 中搭建 AI 知識庫

大部分人使用大模型處理文件都停留在 RAG 模式（檢索增強生成，Retrieval-Augmented Generation）。這是當前 AI 行業最主流的知識管理正規化：上傳檔案，提問時系統檢索相關片段，讓大模型基於這些片段生成回答。NotebookLM、ChatGPT 的檔案上傳，以及幾乎所有的企業級知識庫走的都是這條路。

前段時間，AI 領域的著名研究者 Andrej Karpathy 提出了一個新想法。他認為 RAG 的主要問題在於：每一次提問，模型都要從零開始重新發現知識。如果你問了一個需要綜合五篇文件的問題，RAG 會檢索、拼接、生成；如果你明天再問同樣的問題，它會重複整個過程，沒有任何積累，也沒有任何記憶。本來可以建立關聯的知識，卻在一次又一次的反覆查詢中被浪費掉了。

Karpathy 給出的解決方案是 LLM Wiki。他描述的系統分為三層：

原始資料層 — 負責收集論文、文章、播客、網頁等素材。大模型對這一層只讀不改。
Wiki 層 — 大模型擁有這一層的完整所有權。它負責編寫 Markdown 檔案、目錄、摘要、實體概念、比較分析和綜述，建立頁面、更新頁面，並維護交叉引用。我們只需要負責閱讀。
Schema 層 — 一個設定檔案，例如對於 Codex 來說就是 AGENTS.md，對於 Cursor 來說就是 .cursorrules。告訴大模型這個 Wiki 的結構規範、命名約定和工作流程，並在使用過程中共同迭代這份檔案。

繁中教學圖

本篇介紹如何參考 Karpathy 的理念，在 Obsidian 裡藉助 Codex 搭建一套 LLM Wiki 知識庫。

1. 參考 Karpathy 的 GitHub 倉庫

首先找到 Karpathy 分享的 LLM Wiki 原始設計文件，瞭解他的設計理念：

https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f

2. 在 Obsidian 裡建立 Wiki 倉庫

在本地新建一個 Obsidian 倉庫，然後把以下提示詞發給 Codex：

你現在是我的 LLM Wiki Agent。
把下面這份 idea 檔案原樣落地，作為我完整的第二大腦，一步一步地執行，
建立擁有完整規則的系統。落地過程嚴格參考以下 GitHub 倉庫的內容：
https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f

Codex 會根據內容幫你建立一套符合 LLM Wiki 理念的本地知識庫結構：

繁中教學圖