马少平THU 25-01-28 09:47
微博认证:清华大学计算机系教授 马少平

刚了解到,DeepSeekMath论文的一作是我们实验室毕业的博士生邵智宏,该论文中提出了deepseek的主要创新之一的GRPO。该工作应该是他读博期间完成的,估计是在deepseek实习期间完成的,其他作者也都是deepseek的。 ​

发布于 北京