Barret李靖 25-09-22 21:28
微博认证:阿里巴巴职员 科技博主 头条文章作者

借助 LLM 学习 LLM,边学边问😃,《图解DeepSeek技术》这本小册子,不到一百页,把推理大模型的基本原理、MoE 架构设计和 R1 训练过程等几个东西讲清楚了,值得读两遍。 ​

发布于 浙江