云南516 26-05-02 21:16

2026年4月,华为在深圳正式启动昇腾950PR大规模量产。 这款单卡FP4算力1.56PFlops的推理芯片,性能是英伟达针对中国特供的H20的2.8倍。

刚过去的4月底,字节跳动确认抛出56亿美元采购单,锁定约35万颗,直接创下国内AI芯片采购的历史纪录。 现在国内AI基建已经彻底从“凑合用的备份”,转成主动选国产替代的阶段。

DeepSeek V4的发布是关键转折点。 这款1万亿参数的MoE大模型,原本定在2026年初发,特意推迟了3个月重构,专门适配昇腾950PR和寒武纪的硬件。 阿里云、腾讯云在V4发布当天就完成了全栈部署。 全行业都看得懂:硬件性能突破和软件生态解耦正在同步发生,英伟达靠CUDA锁了十几年的开发者生态,真的要松了。

FP4性能反超H20 昇腾产能直接拉满

昇腾950PR直接把国产AI芯片的性能天花板抬了一大截。 FP4精度下1.56PFlops的推理吞吐量,比英伟达H20高1.8倍。 它也是目前唯一支持FP4压缩格式的国产芯片,跑大规模MoE模型的时候,内存带宽消耗更低,能扛更多并发请求。

产能兑现的突破比参数更实在。 华为2026年全年计划出货75万颗,单价约1.6万美元,现在现货价格已经因为抢货涨了20%,完全是卖方市场。 75万颗的年产能,意味着昇腾950PR已经从实验室样品变成了工业级基础设施,足够扛住全国数百万并发AI查询的需求。 字节一家的35万颗订单就占了全年规划产能的近一半,头部互联网厂的算力采购逻辑早就变了。

发布于 云南