智多星2026 26-04-25 13:03
微博认证:美妆博主

英伟达的“铁王座”要坐不稳了?昇腾CANN打响国产AI算力替代第一枪!

当DeepSeek V4系列模型带着开源的光环登场,所有人都看到了国产大模型的高光时刻,但很少有人注意到,支撑它跑起来、跑得快的“隐形基石”——昇腾CANN异构计算架构,正悄悄掀起一场算力底层的革命。这不是又一次概念炒作,而是国产AI从“依赖进口”到“自主可控”的关键一跃。

就在4月24日,DeepSeek V4-pro和V4-Flash正式发布并开源,华为昇腾同步完成了对这两大模型的0-day适配支持。依托CANN架构,昇腾A3超节点产品实现了V4-Flash的续训练,通过TorchTitan-NPU插件与Autofuse自动融合技术,让大模型训练实现了“开箱即优”的效果。更关键的是,CANN实现了超95%的CUDA代码兼容,配合一键迁移工具,模型从英伟达平台向昇腾迁移的时间从按月计缩短到了按小时计,这意味着国产算力的“生态鸿沟”正在被快速填平。

这场适配的背后,是CANN技术的持续迭代。最新的CANN 8.5.2版本不仅修复了算子运算的稳定性问题,还新增了上百个融合算子与API,自研的NB2.0和NHR集合通信算法,让超节点集群的训练效率大幅提升。而在产业端,从皖通科技到拓维信息,十余家上市公司早已完成CANN架构的适配与兼容测试,东方国信、云从科技等企业更是直接构建起基于昇腾的大模型训推平台,从金融医疗到智慧城市,CANN的生态版图正在快速扩张。

过去,国产AI算力始终绕不开英伟达的CUDA生态,而CANN的崛起,正在打破这一垄断。它不仅让DeepSeek这样的国产大模型摆脱了对海外算力的依赖,实现了软硬件全栈国产化,更能大幅降低AI训练推理的使用成本,满足本土行业私有化部署的需求。当CANN与DeepSeek这样的开源模型强强联合,国产AI算力的闭环生态正在加速成型,这不仅是技术的突破,更是产业的突围。

这场变革里,我们看到的不是一个架构的胜利,而是中国AI产业从底层开始的自主觉醒。CANN的崛起,不是要简单复制英伟达的路径,而是要走出一条属于自己的算力生态之路。当越来越多的国产模型、国产芯片、国产应用汇聚在CANN的旗帜下,国产AI算力的“根”才算真正扎稳。未来,或许我们再谈起大模型训练,想到的不再是英伟达,而是昇腾,是CANN,是属于我们自己的算力底气。

发布于 广东