梁赛 25-08-20 10:52
微博认证:AI博主

DeepSeekV3.1开始有一些测评出来了,不是特别全面,但大致印象:
1、编程能力大幅提升,有人认为超过GPT-5。
2、写作表现上,有人反馈不如之前的版本。

昨天这个版本最值得注意的是,V3不再以日期来命名版本号,之前都是0324,0528,这次从V3.1开始。

这意味着,如果下个版本是V3.2,那么,V4的到来,会有相当长一段时间。

毕竟,如果V4和R2是在昇腾集群上训练,是有相当多的工作要重新开始做的。V3之前的训练是基于英伟达的H800集群,要切换到昇腾集群,过程会比较漫长,有很多架构层面的优化要做,这是个前无古人的工作,会比较寂寞,但一旦跑通,对国内大模型的自主创新生态非常有意义。

发布于 广东