DeepSeekV4适配华为升腾

#DeepSeekV4适配华为升腾#

这事儿直接改写全球AI格局：国产顶流大模型DeepSeekV4，全栈适配华为昇腾，彻底甩掉英伟达CUDA，黄仁勋9天前说的“灾难”，真的成真了。

4月24日，DeepSeek V4-Pro/Flash正式发布并开源，1M超长上下文（此前128K），万亿参数MoE架构，核心指标追平甚至超越GPT-5.5 。同一天，华为官宣：昇腾全系列（950/A3）完成原生适配，从训练到推理全链路扎根CANN框架，重写200+核心算子。

性能直接炸裂

- 昇腾950：V4-Pro推理仅20ms，单卡吞吐4700TPS；Flash版10ms/1600TPS，性能是英伟达H20的2.87倍。
- 价格杀疯：Flash版2元/百万token，Pro版24元，比GPT-5.5便宜50倍+。
- 全栈自主：从模型、算力到框架，100%国产链，彻底绕开美国技术栈。

为啥是转折点

以前全球AI被英伟达卡脖子，CUDA是绕不开的护城河。现在DeepSeekV4+昇腾，证明顶级大模型完全能在国产芯片上跑得更快、更便宜、更稳。黄仁勋怕的不是模型变强，是AI生态去CUDA化——这是英伟达二十年根基的最大威胁。

简单说：中国AI不再看别人脸色，芯片+模型双自主的时代，真的来了。

发布于泰国