Karpathy的知识管理法,我用半天跑通了!
上周,我刷到Andrej Karpathy发了一条推文,非常有启发。
他在推文里分享了一下他自己搭建个人知识库的方法,大概流程是:
先把一堆各种来源的原始素材收集到一起,然后让LLM把它们编译成一个wiki,也就是一堆有结构、有索引、有互相链接的markdown文档。
人几乎不需要直接编辑这个wiki,所有维护工作都交给LLM。
看完这条推文,我很兴奋,想立马复刻一个出来。
但这套方法对很多小白来说门槛还是有点高,我就想到用AutoClaw试一下。
这是我一直在用的一个工具,它最新更新的两个特性让我觉得非常适合用来简化Karpathy的方法:
一个是Skills商店,一个是自进化机制。
下面具体来根大家分享一下我是怎么实现的,超级简单,大家可以收藏好,亲自试一下!
1
我做自媒体以来,一直有个很大的痛点:经验一直在积累,但知识却没有真正形成体系。
备忘录里有选题灵感,flomo里有一些好的文章收藏,还有语雀、obsidian以及浏览器书签......
这些东西加在一起,数量非常庞大,但它们之间没有任何关联。
Karpathy的解法是什么?
他提出了一个关键概念——「编译」。
就像代码需要编译才能运行一样,零散的原始素材也需要经过一次编译,才能变成真正可用的知识。
这个编译过程包括:提炼核心观点、建立分类结构、创建概念之间的链接、写摘要和索引。
而这个编译的执行者,是LLM。
我们拆解一下Karpathy的方法,核心工作流其实分五步:
收集——把各种来源的原始素材(文章、论文、代码库、数据集、图片)统一归入一个raw目录。
他用Obsidian Web Clipper把网页一键裁剪成markdown,配合快捷键把相关图片也下载到本地。
编译——让LLM读取raw目录里的所有素材,增量式地编译成一个wiki。
这个wiki就是一组有目录结构的markdown文件,包含每份素材的摘要、反向链接,还会自动把内容归类成不同概念,为每个概念写专题文章,并建立它们之间的交叉链接。
问答——当wiki积累到一定规模,你就可以对着这个知识库提各种复杂问题,LLM会自动去翻阅相关文档来回答。
回填——每次问答产出的结果(分析文档、幻灯片、数据图表),可以归档回wiki里。
相当于你每做一次探索,知识库就变强一点。
健康检查——定期让LLM对整个wiki做一次扫描,找出数据不一致的地方、补充缺失信息、发现可以深挖的新关联。相当于给知识库做体检。
五步连起来就是一个飞轮:收集→编译→使用→回填→优化→继续收集。
用得越多,知识库越强,知识库越强,用起来越高效。
2
那我是怎么做的呢?
首先,我先在AutoClaw里新建一个森森知识库小助理,让它后续帮我维护我的个人知识库。
第一步:收集素材
我把自己大半年的内容积累做了一次集中清理,大部分素材本来就是自己写的中文内容,复制粘贴就行。
以语雀为例,我可以直接把我的Personal Access Token给我的小助理,它就可以写脚本批量导出到我的本地知识库。
这个过程会比较久,可以多等一会。
第二步:用Skills冷启动
用Karpathy的方法,LLM编译wiki靠的是模型本身的通用能力加上他自己写的提示词。
但如果你对某个领域没有足够的认知框架,你甚至不知道该让LLM怎么分类。
我在AutoClaw的Skills商店里装了几个内容创作相关的技能包。
其实不只是内容创作,你需要什么领域的专业能力就装什么。
这些技能包是AutoClaw和各领域专家共创的,装完之后它在对应方向上的判断力会明显提升。
装完技能之后,我告诉它:我要把这些素材整理成选题、写作、运营、变现四个模块的知识库,每个模块下面有若干篇方法论文档,文档之间需要有逻辑关联。
它很快给出了框架建议。
第三步:编译过程中的自进化
分批把素材喂给AutoClaw之后,编译过程就开始了。
这个过程会有一些好玩的事情,比如,我有一篇旧文里用了很多过时的网络梗做案例,它原封不动搬了过来。
我说:方法论文档里的案例要用经典的、不容易过时的表达。
然后屏幕上弹出一张橙色卡片,问我要不要确认,我点了确认。
到第三批素材时,它生成的文档已经自动换成了更经典的案例。
第四步:问答和回填
四个模块十六篇文档编译完成后,我开始做知识库的问答和回填。
比如我问它:"根据已有的方法论,我如果要做一个新的垂直账号,前三个月的内容策略应该怎么排?"
它会调用选题模块和运营模块的内容交叉分析,给出一个具体的建议方案。
这个方案我微调之后,直接让它整理成一篇新的文档补进运营模块。
这就是回填。每次使用知识库产生的成果,重新喂回去,知识库就更完整了。
3
当然,Karpathy的完整工作流,AutoClaw目前没法百分之百覆盖。
比如本地文件管理和浏览,Karpathy用Obsidian作为wiki的前端,所有文件存在本地,可以Git版本控制。
AutoClaw生成的文档最好也导出为markdown,在Obsidian里建一个对应的目录结构来浏览。
两个工具配合使用,AutoClaw负责编译,Obsidian负责呈现和存档。
如果你也有一堆散落各处的经验和素材一直想整理但迟迟没动手,可以试试这个思路,持续使用、持续回填、持续进化。
半天时间跑通第一轮,之后就是飞轮转起来的事了。
#AutoClaw #澳龙 #Karpathy #知识管理 #AI助手 #效率工具
