Karpathy 推出的 nanochat,不只是一个简单的“入门台阶”,它实质上是一个迷你实验室——一个可供任何人亲手尝试的小型语言模型系统。它不仅成本低(大约100美元,4小时训练时间),还能表现出一种“幼儿”般的好奇与天真,时常犯错但总让人惊喜。
nanochat 完整呈现了预训练、监督微调和强化学习的全流程,缩小了AI学习的抽象距离,让机器智能的本质变得触手可及。Karpathy 通过合成对话,赋予它身份和行为,甚至教它数字母,这样的设计帮助大家理解数据如何塑造模型的“自我”和能力。
更有趣的是,Karpathy还在思考用扩散模型替代传统自回归文本模型的可能,以及未来模型如何突破“文本”这一限制,直接从视觉等多模态信息中学习。nanochat也成为测试新技术(如BF16到FP16转换)的实验平台。
简言之,nanochat让AI教育从抽象走向具体,从遥远走向身边。它是一个轻量级、开放且透明的微观世界,让学习者通过实操理解复杂AI系统的奥秘。这样的手把手教学,或将成为未来技术教育的关键路径。
原文:x.com/TheTuringPost/status/1985709238522691783
发布于 河北
