DeepSeek V4模型国产化进程

DeepSeek V4 万亿参数MoE模型

联合菊厂工程师驻场开发

整体从首次尝试到最终商用落地历时大约1年左右

其他N卡厂商

完成从预训练、微调、强化学习对齐到推理部署的全生命周期国产化

财财预计需要9-15个月左右『有专业人士评估一下吗？』（没有菊厂驻场的前提下）

现在的N卡大模型，换成菊卡，想要性能不输于当下、『不再是简单的CUDA代码迁移、而是针对昇腾架构、CANN软件栈进行模型原生重构』[笑cry] 可能需要9个月以上

有几点：

菊卡使用成本更低、意味着你的算力成本更低

假如菊卡供货量不足、会优先供应给贡献者『千亿星火』『万亿V4』

菊卡本身绑定的中国政务、医疗、教育、金融、工业『因为有强制国产化的需求』、会优先适配给两位贡献者

菊卡假如不被『Match』、需求肯定会爆

某火大模型、它的先发优势会随CANN生态扩张持续放大、形成强者恒强的马太效应

DSV4、某火大模型方案与菊卡算力深度绑定、可直接复用华为几十年积累的渠道资源、实现行业落地的快速渗透

#小学生春游游到自己家后爆哭#

春游游到自己家，心态肯定会崩[笑cry][笑cry][笑cry]

发布于广东