人工智涨Ultra
26-05-30 21:04 微博认证:科技博主

#人工智涨ultra的行业观察##梁文峰对华为的态度#

梁文峰的Deepseek确实把代码迁移到了华为昇腾上……

但是肯定不只五个月……

至少从Deepseek的上一代模型开始,推理优化就一直在迁移昇腾……

不只是昇腾,对寒武纪等其他国产芯片也做了适配优化……

不过Deepseek的github上也明确标明了对英伟达硬件的支持,我还是倾向基础模型还是在英伟达SM100上训练……

所以彻底抛弃英伟达怎么说?肯定是假的……

另外,千问,GLM,阶越星辰,商汤,讯飞,字节,腾讯等国产大模型,都对昇腾芯片进行了深度迁移优化,有些甚至更早,投入也更大……

所以,梁文峰这一波是怎么回事?

对昇腾的适配,Deepseek和华子都还要感谢袁进辉老师的硅基流动的早期推动……

Deepseek搞不好还是国内拥有英伟达卡最多的纯大模型公司,至少在很长一段时间内是,对N卡的优化和使用也是最深度的!

梁文峰在这一块和其他国产模型相比,比如科大讯飞,算后来者……

不过确实也是给昇腾帮了两次大忙,特别是910B这一代……

芯片和模型的适配是双向奔赴,双方投入都很大……

这个什么数码爷,喜欢利用一些新闻结合自己的编纂来搞沸腾……

发布于 广东