昇腾CANN挑战英伟达

英伟达的“铁王座”要坐不稳了？昇腾CANN打响国产AI算力替代第一枪！

当DeepSeek V4系列模型带着开源的光环登场，所有人都看到了国产大模型的高光时刻，但很少有人注意到，支撑它跑起来、跑得快的“隐形基石”——昇腾CANN异构计算架构，正悄悄掀起一场算力底层的革命。这不是又一次概念炒作，而是国产AI从“依赖进口”到“自主可控”的关键一跃。

就在4月24日，DeepSeek V4-pro和V4-Flash正式发布并开源，华为昇腾同步完成了对这两大模型的0-day适配支持。依托CANN架构，昇腾A3超节点产品实现了V4-Flash的续训练，通过TorchTitan-NPU插件与Autofuse自动融合技术，让大模型训练实现了“开箱即优”的效果。更关键的是，CANN实现了超95%的CUDA代码兼容，配合一键迁移工具，模型从英伟达平台向昇腾迁移的时间从按月计缩短到了按小时计，这意味着国产算力的“生态鸿沟”正在被快速填平。

这场适配的背后，是CANN技术的持续迭代。最新的CANN 8.5.2版本不仅修复了算子运算的稳定性问题，还新增了上百个融合算子与API，自研的NB2.0和NHR集合通信算法，让超节点集群的训练效率大幅提升。而在产业端，从皖通科技到拓维信息，十余家上市公司早已完成CANN架构的适配与兼容测试，东方国信、云从科技等企业更是直接构建起基于昇腾的大模型训推平台，从金融医疗到智慧城市，CANN的生态版图正在快速扩张。

过去，国产AI算力始终绕不开英伟达的CUDA生态，而CANN的崛起，正在打破这一垄断。它不仅让DeepSeek这样的国产大模型摆脱了对海外算力的依赖，实现了软硬件全栈国产化，更能大幅降低AI训练推理的使用成本，满足本土行业私有化部署的需求。当CANN与DeepSeek这样的开源模型强强联合，国产AI算力的闭环生态正在加速成型，这不仅是技术的突破，更是产业的突围。

这场变革里，我们看到的不是一个架构的胜利，而是中国AI产业从底层开始的自主觉醒。CANN的崛起，不是要简单复制英伟达的路径，而是要走出一条属于自己的算力生态之路。当越来越多的国产模型、国产芯片、国产应用汇聚在CANN的旗帜下，国产AI算力的“根”才算真正扎稳。未来，或许我们再谈起大模型训练，想到的不再是英伟达，而是昇腾，是CANN，是属于我们自己的算力底气。

发布于广东