酱紫表 25-02-09 23:00
微博认证:数码博主 微博原创视频博主

花了三个半小时在 YouTube 看完了 Karpathy 的《深入探索 ChatGPT 类大模型》,应该是目前入门了解大模型最好的视频?视频是做给普通用户的,搭配沉浸式翻译基本都能看懂。
- Karpathy 是 OpenAI 创始成员,后来加入特斯拉当人工智能总监,现在又回到了 OpenAI 并且在 YouTube 做免费教学视频。
视频里深入浅出的讲了大模型原理和知识,还推荐了很多学习的网站和材料,是牛逼人做的牛逼视频。简单介绍下视频里的内容:
- 什么是训练数据?以及从哪里获取
- 什么是 Token?我们和 AI 对又是如何转化成 Token 的
- 神经网络的输入输出
- 神经网络的内部结构
- 演示开源的 GPT2 是如何训练和推理的
- Meta 开源的 Llama 3.1 基础模型是如何推理的
- 什么是预训练和后训练
- 训练后的模型如何成为日常能对话的 AI
- 大模型的幻觉是如何产生的,为什老是自信的胡说八道,以及如何规避
- 大模型自我认知的问题(例:为什么问 DeepSeek 等模式你是谁,都会回答是 OpenAI)
- 大模型为什么需要 Token 进行思考
- 大模型的在数学、和认知上的缺陷(例子:9.9 和 9.11 的问题)
- 什么是人工监督微调和强化学习
- 强化学习的原理
- DeepSeek R1 如何通过强化学习变的强大
- AlphaGo 又是如何通过强化学习变强
- 强化学习和人类反馈的关系
- 大模型未来的发展方向
- 在哪追踪大模型的发展
- 在哪找到这些大模型
🔗 www.youtube.com/watch?v=7xTGNNLPyMI

发布于 安徽