是煦煦哟 26-03-22 11:30
微博认证:科技博主 超话小主持人(科技超话)

华为这波有点猛!昇腾950PR加速卡现身,算力直接压了H20一头

华为这次在合作伙伴大会2026上掏出来的东西,有点东西。

Atlas 350,搭载全新昇腾950PR处理器,官方给的定位是AI训练推理加速卡。说人话就是:给大模型跑推理用的“加速器”。但真正让我盯着参数看了好一会儿的,是那组对比数据——单卡算力达到了英伟达H20的2.87倍 。

这数字不是随便说说的。华为昇腾计算业务总裁张迪煊的原话是“目前国内唯一支持FP4低精度的推理产品” 。FP4这玩意儿听起来玄乎,其实逻辑很简单:用精度换效率。一个700亿参数的模型,用FP16跑需要140GB显存,FP4只需要35GB,单卡就能直接加载,推理延迟直接往下掉 。这意味着什么?意味着同样的硬件,能跑的模型更大,响应更快。

除了算力,内存也有看点。112GB的HBM,带宽1.4TB/s 。多模态生成速度提升60%,小算子访存效率翻了4倍——这些对推荐系统、短视频、电商这种高并发场景来说,都是实打实的体验提升 。

当然,600W的功耗是H20的1.5倍 ,这个得认。但换个角度想,性能近三倍,功耗多一半,这笔账怎么算,得看具体场景。

有意思的是,这次不只是发了个卡。昆仑、华鲲振宇、神州鲲泰等7家核心伙伴,直接在会上发布了基于Atlas 350的服务器整机 。软通动力的产品负责人用了“核武级”算力来形容 ——这词儿听着有点中二,但能看出来伙伴们是真兴奋。

科大讯飞也表态了,新一代星火大模型要与昇腾910/950系列适配 。智谱在昇腾上花了3个月就训出了GLM-Image,登顶Hugging Face Trending榜 。这些例子说明一件事:生态不是喊出来的,是真有人用、能跑通、能出活。

还有个细节值得注意。华为在会上提到,面向百亿级、千亿级、万亿级模型,他们分别有不同的产品和方案 。不是所有人都需要几千张卡堆超节点,8卡满足基础推理、64卡突破性能瓶颈,这种分层打法挺务实。

最后说个花絮。现场展台成了“网红打卡点”,很多人围着看参数 。这年头,能让人愿意排队看的国产硬件,不多。

算力这东西,最终还是要落到“好用”上。 Atlas 350的参数是一回事,能不能帮开发者把模型跑顺、把业务跑快,是另一回事。但从目前的落地情况看,这条路走得还算稳。 http://t.cn/AXfpykK8

发布于 福建