问鼎龙虎榜
26-05-04 13:38 微博认证:投资内容创作者 财经观察官

国芯,封神了

AI圈最炸的事。

DeepSeek-V4,全线换上了国产芯片。

不是测试,不是实验室。

是真正的量产部署。

是万亿参数大模型,跑在纯国产算力上。

这是2026年4月,中国AI的“奇点时刻”。

一句话总结这件事

过去,中国大模型靠英伟达GPU活着。

现在,DeepSeek用自己的模型,搭配华为昇腾芯片,跑通了。

从模型到芯片,全链路自主。

这不是备胎转正。

这是正面宣战。

一、为什么要换?三个硬理由

1. 外面不给了

高端GPU被卡。

你不换,就得停。

2. 不想只当“租户”

用别人的芯片,永远在看别人脸色。

换自己的芯片,才能定义规则。

3. 算法倒逼硬件

单卡不够强,就用集群补。

用聪明的软件,跑赢落后的工艺。

二、技术到底有多硬?五个数据说话

· 全球首个:万亿参数的MoE模型,跑在纯国产算力上。

· 代码迁移:从CUDA到华为CANN,兼容率约95%。

· 集群救场:华为“超节点”方案,把算力利用率从30%拉到45%。

· 推理加速:自研专家并行算法,在昇腾上提速1.5到1.96倍。

· FP4破解:连英伟达Blackwell才支持的精度,也被算法转化跑通。

一句话:用工程弥补工艺,用软件硬扛硬件。

三、市场马上给出了反应

发布当天:

· 港股中芯国际涨超10%

· 华虹半导体涨超15%

· A股科创芯片ETF涨3.2%

这不是概念。是真金白银的投票。

更惊人的是成本:

华为昇腾950PR推理卡,支持FP4精度。

单卡推理性能 = 英伟达H20的 2.87倍。

DeepSeek-V4 Pro的定价:

24元 / 百万Tokens。

对比同类产品,成本优势超过 100倍。

四、接下来会发生什么?

1. AI应用,真的要爆发了

推理成本被打下来。

百万上下文,单Token算力降到V3.2时代的10%~27%。

Agent应用、复杂任务、实时交互——全部成为可能。

2. 国产算力,进入正循环

2025年,国内AI加速卡市场中,国产芯片份额已经 41%。

真实商用 → 暴露问题 → 快速迭代。

华为已规划未来三年多款昇腾新品。

开发者生态,正在成型。

3. 英伟达,第一次感受到真压力

以前是中国AI求你。

现在是中国AI绕开你。

五、别嗨过头,还有三个坎

1. 软件生态还不够顺

大规模训练时,昇腾的稳定性和集群通信仍有差距。

CANN工具链,还需要继续追CUDA。

2. 单卡性能仍有代差

集群补上了部分短板。

但单芯片理论峰值、先进工艺,依然有距离。

3. 长期依赖要打破

不是换一次芯片就完事。

需要持续投入、持续优化、持续淘汰落后产能。

最后说三句

1. DeepSeek-V4用国产芯片,不是“可用”,是“好用”。

2. 这不是一个公司的胜利,是一条产业链的觉醒。

3. 中国AI,从此有了自己的节奏。

国产芯片+国产模型=

不再看别人脸色。

发布于 陕西