刚了解到,DeepSeekMath论文的一作是我们实验室毕业的博士生邵智宏,该论文中提出了deepseek的主要创新之一的GRPO。该工作应该是他读博期间完成的,估计是在deepseek实习期间完成的,其他作者也都是deepseek的。
发布于 北京
刚了解到,DeepSeekMath论文的一作是我们实验室毕业的博士生邵智宏,该论文中提出了deepseek的主要创新之一的GRPO。该工作应该是他读博期间完成的,估计是在deepseek实习期间完成的,其他作者也都是deepseek的。