华为启动昇腾950PR量产

2026年4月，华为在深圳正式启动昇腾950PR大规模量产。这款单卡FP4算力1.56PFlops的推理芯片，性能是英伟达针对中国特供的H20的2.8倍。

刚过去的4月底，字节跳动确认抛出56亿美元采购单，锁定约35万颗，直接创下国内AI芯片采购的历史纪录。现在国内AI基建已经彻底从“凑合用的备份”，转成主动选国产替代的阶段。

DeepSeek V4的发布是关键转折点。这款1万亿参数的MoE大模型，原本定在2026年初发，特意推迟了3个月重构，专门适配昇腾950PR和寒武纪的硬件。阿里云、腾讯云在V4发布当天就完成了全栈部署。全行业都看得懂：硬件性能突破和软件生态解耦正在同步发生，英伟达靠CUDA锁了十几年的开发者生态，真的要松了。

FP4性能反超H20 昇腾产能直接拉满

昇腾950PR直接把国产AI芯片的性能天花板抬了一大截。 FP4精度下1.56PFlops的推理吞吐量，比英伟达H20高1.8倍。它也是目前唯一支持FP4压缩格式的国产芯片，跑大规模MoE模型的时候，内存带宽消耗更低，能扛更多并发请求。

产能兑现的突破比参数更实在。华为2026年全年计划出货75万颗，单价约1.6万美元，现在现货价格已经因为抢货涨了20%，完全是卖方市场。 75万颗的年产能，意味着昇腾950PR已经从实验室样品变成了工业级基础设施，足够扛住全国数百万并发AI查询的需求。字节一家的35万颗订单就占了全年规划产能的近一半，头部互联网厂的算力采购逻辑早就变了。

发布于云南