万能的大熊
26-06-30 21:57 微博认证:《格局逆袭:普通人的制胜之道》作者 电商专家

美团正式发布了LongCat-2.0,1.6万亿参数,全流程在5万张国产算力卡上完成训练和推理,英伟达含量为零,这是目前公开信息里,第一个在纯国产算力集群上从零跑通的万亿参数大模型。5万张国产卡,从零开始预训练,堆出了一个1.6万亿参数的MoE模型,而且是100万上下文,是非常重大的一个行业突破。虽然美团没有说用的是什么卡,但之前有报道美团自2023年起与华为深度模芯协同,打通万卡级分布式训练、国产集群容错调度整套工程方案,是国内最大规模昇腾万亿模型训练落地案例。

所以大概率5万张里大部分是华为昇腾卡,少部分是寒武纪。推理部分会有更多的国产卡参与。昇腾也是国内唯一具备5万卡级大规模分布式训练成熟生态的国产算力,HCCL通信、大显存NPU、分布式框架适配能力也足以匹配万亿MoE训练需求;寒武纪、通用GPU厂商当前万卡级稳定训练落地案例则较少,还是推理为主。美团除采购昇腾、寒武纪算力卡外,一级市场还投资了沐曦、摩尔线程、紫光展锐等国产芯片企业,构建了多路线国产算力储备。

发布于 北京