刚了解到，DeepSeekMath论文的一作是我们实验室毕业的博士生邵智宏，该论文中提出了deepseek的主要创新之一的GRPO。该工作应该是他读博期间完成的，估计是在deepseek实习期间完成的，其他作者也都是deepseek的。 _新浪新闻

马少平THU 25-01-28 09:47

微博认证：清华大学计算机系教授马少平

刚了解到，DeepSeekMath论文的一作是我们实验室毕业的博士生邵智宏，该论文中提出了deepseek的主要创新之一的GRPO。该工作应该是他读博期间完成的，估计是在deepseek实习期间完成的，其他作者也都是deepseek的。

发布于北京