闫跃龙 26-04-25 07:31
微博认证:科技博主 头条文章作者

#DeepSeekV4适配华为升腾#

这事儿直接改写全球AI格局:国产顶流大模型DeepSeekV4,全栈适配华为昇腾,彻底甩掉英伟达CUDA,黄仁勋9天前说的“灾难”,真的成真了。

4月24日,DeepSeek V4-Pro/Flash正式发布并开源,1M超长上下文(此前128K),万亿参数MoE架构,核心指标追平甚至超越GPT-5.5 。同一天,华为官宣:昇腾全系列(950/A3)完成原生适配,从训练到推理全链路扎根CANN框架,重写200+核心算子。

性能直接炸裂

- 昇腾950:V4-Pro推理仅20ms,单卡吞吐4700TPS;Flash版10ms/1600TPS,性能是英伟达H20的2.87倍。
- 价格杀疯:Flash版2元/百万token,Pro版24元,比GPT-5.5便宜50倍+。
- 全栈自主:从模型、算力到框架,100%国产链,彻底绕开美国技术栈。

为啥是转折点

以前全球AI被英伟达卡脖子,CUDA是绕不开的护城河。现在DeepSeekV4+昇腾,证明顶级大模型完全能在国产芯片上跑得更快、更便宜、更稳。黄仁勋怕的不是模型变强,是AI生态去CUDA化——这是英伟达二十年根基的最大威胁。

简单说:中国AI不再看别人脸色,芯片+模型双自主的时代,真的来了。

发布于 泰国