蚁工厂 25-10-29 20:32
微博认证:科技博主

Andrej Karpathy 前一阵发的教学项目nanochat 很受好评,不过对初学者来说还是有难度的。
datawhale基于该项目开了个中文教程 Code Your Own LLM:github.com/datawhalechina/code-your-own-llm
不过项目刚启动,目前内容只有一点点,可以先关注下等有内容了再来看。

项目目标:Code Your Own LLM 是一个基于 nanochat 的深度扩展项目,旨在提供一份从原理到实践、从算法到工程的全栈式大语言模型参考指南。我们将提供最简洁的代码实现,没有复杂封装、层层继承和不必要的抽象,用极致的扁平化结构,零层级嵌套和极简的项目依赖来实现大语言模型从零训练到工程落地的整套流程。此外,项目补充了深入的算法原理讲解、详细的复现教程、前沿的优化技术分析,以及丰富的可视化交互。
#微博兴趣创作计划#

发布于 山东