DeepSeek V4 万亿参数MoE模型
联合菊厂工程师驻场开发
整体从首次尝试到最终商用落地历时大约1年左右
其他N卡厂商
完成从预训练、微调、强化学习对齐到推理部署的全生命周期国产化
财财预计需要9-15个月左右『有专业人士评估一下吗?』(没有菊厂驻场的前提下)
现在的N卡大模型,换成菊卡,想要性能不输于当下、『不再是简单的CUDA代码迁移、而是针对昇腾架构、CANN软件栈进行模型原生重构』[笑cry] 可能需要9个月以上
有几点:
菊卡使用成本更低、意味着你的算力成本更低
假如菊卡供货量不足、会优先供应给贡献者『千亿星火』『万亿V4』
菊卡本身绑定的中国政务、医疗、教育、金融、工业『因为有强制国产化的需求』、会优先适配给两位贡献者
菊卡假如不被『Match』、需求肯定会爆
某火大模型、它的先发优势会随CANN生态扩张持续放大、形成强者恒强的马太效应
DSV4、某火大模型方案与菊卡算力深度绑定、可直接复用华为几十年积累的渠道资源、实现行业落地的快速渗透
#小学生春游游到自己家后爆哭#
春游游到自己家,心态肯定会崩[笑cry][笑cry][笑cry]
发布于 广东
