阑夕 26-04-25 21:52
微博认证:逐鹿网(www.zhulu.com)创始人 长文原创作者 2024微博年度新知博主

DeepSeek-V4刷屏之后,模型本身的肌肉数值是符合预期的,仍然占据着开源阵营里的头部位置,但跟跑分比起来,更值得关注的,其实是所谓的地基。

好像也就是前几个月,黄仁勋说哪怕对手免费出售芯片也撼动不了英伟达的市场优势,言外之意,就是CUDA生态已经成为行业公认的几乎唯一水源了,猴头可以蹦跶,但一定跳不出五指山。

然后就有了DeepSeek-V4,一个万亿参数级别的模型,训练推理全流程都跑在纯国产算力上,CUDA在这个量级里从头到脚被完整替代,还是头一回。

可以去看一下UP主GenJi最新一期用可视化动图做的视频,让小白也能轻松看懂DeepSeek升级的来龙去脉,国产模型试着丢掉拐杖自己迈出去第一步,从「炸裂」程度上讲,V4不论跟V3还是R1相比,都是毫不逊色的。

发布于 北京