#模型时代# Andrej Kaparthy 3小时讲座4K版：如何深入理解ChatGPT等大语言模型这个讲座Andrej Kaparthy已经发布几天，由于实在是太长，3个半小时之巨。用我的AI工作流处理的时候，也遇到过多次崩溃，但最终还是整理出一个版本。这个讲座的价值意义，就不用我多做介绍了，含金量百分之一万。而且，既

#模型时代# Andrej Kaparthy 3小时讲座4K版：如何深入理解ChatGPT等大语言模型

这个讲座Andrej Kaparthy已经发布几天，由于实在是太长，3个半小时之巨。用我的AI工作流处理的时候，也遇到过多次崩溃，但最终还是整理出一个版本。这个讲座的价值意义，就不用我多做介绍了，含金量百分之一万。而且，既然已经很长了，所以干脆传一个4K 版本，这样PPT上的字符更清晰。

接下来，直接附上讲座的原始简介，以示尊重（其实是我自己还没听完[干饭人]）：

***
Andrej Kaparthy：这是面向大众的深度探讨，介绍为 ChatGPT 等相关产品提供支持的大型语言模型（LLM）AI 技术。内容涵盖了从模型开发到思考模型“心理”的心智模型，以及如何在实际应用中最大化地使用它们的全部训练过程。我在大约一年前已经发布过一个“LLMs 简介”的视频，但那只是一次随意演讲的重录。因此，我想重新回来做一个更全面的版本。

个人简介：
Andrej 曾是 OpenAI 的创始成员（2015 年），之后在特斯拉（Tesla）担任 AI 高级总监（2017-2022 年），现在是 Eureka Labs 的创始人，该机构正在建设一所 AI 原生的学校。他在本视频中的目标是提高人们对 AI 最新技术状态的了解和理解，并帮助人们有效地在工作中使用最新、最强大的技术。

更多信息可见 karpathy.ai/ 和 x.com/karpathy

00:00:00 介绍（introduction）
00:01:00 预训练数据（pretraining data）
00:07:47 分词（tokenization）
00:14:27 神经网络输入/输出（neural network I/O）
00:20:11 神经网络内部结构（neural network internals）
00:26:01 推理（inference）
00:31:09 GPT-2：训练与推理（GPT-2: training and inference）
00:42:52 Llama 3.1 基础模型推理（Llama 3.1 base model inference）
00:59:23 从预训练到后训练（pretraining to post-training）
01:01:06 后训练数据（对话数据）（post-training data, conversations）
01:20:32 幻觉、工具使用、知识/工作记忆（hallucinations, tool use, knowledge/working memory）
01:41:46 自我认知（knowledge of self）
01:46:56 模型需要 tokens 来思考（models need tokens to think）
02:01:11 分词再探：模型难以处理拼写（tokenization revisited: models struggle with spelling）
02:04:53 不平滑的智能（jagged intelligence）
02:07:28 监督微调到强化学习（supervised finetuning to reinforcement learning）
02:14:42 强化学习（reinforcement learning）
02:27:47 DeepSeek-R1
02:42:07 AlphaGo
02:48:26 来自人类反馈的强化学习（RLHF, reinforcement learning from human feedback）
03:09:39 展望未来（preview of things to come）
03:15:15 跟踪 LLM 的发展（keeping track of LLMs）
03:18:34 在哪里找到 LLM（where to find LLMs）
03:21:46 总结（grand summary） http://t.cn/A61L9NHe

发布于北京