如果你想真正理解大模型是怎么工作的,但不想啃几百页教科书,推荐一个视频:Andrej Karpathy的"Intro to Large Language Models"。
Karpathy是前特斯拉AI总监、OpenAI联合创始人,现在的身份是AI教育家。这个视频一小时,从tokenization讲到transformer讲到RLHF,全程没有复杂数学公式,纯概念讲解。
说实话我见过的大部分"AI科普"都在讲应用层,这个视频是少数把原理讲清楚又不劝退的。适合想从"会用AI"升级到"理解AI"的人。
YouTube直接搜标题就有,免费。
#AI #LLM #学习资源
发布于 上海
