元力社
26-07-01 08:18 微博认证:元宇宙资讯、产业服务平台!专注元宇宙、大空间、AI等前沿科技。

【#美团发布LongCat2.0#】6月30日,美团正式发布新一代基础大模型LongCat-2.0。这是业界首个依靠国产算力完成训练、推理全流程的万亿参数大模型。

据悉,LongCat-2.0采用MoE架构,总参数规模1.6万亿,每个Token激活参数约480亿,原生支持1M超长上下文,可一次处理百万字级输入。模型深度适配 Claude Code、OpenClaw、Hermes 等主流Harness(测试框架),在Coding任务上表现强劲。

今年4月底,美团曾发布LongCat-2.0-Preview版本,并以匿名方式接入全球最大的大模型API路由平台OpenRouter。OpenRouter数据显示,截至6月底,LongCat-2.0-Preview的总调用量已跻身全球前三。

据悉,2023年起,美团就与国产算力厂商共同推进“模芯协同”研发,从早期的小规模验证到超大规模稳定训练,逐步攻克了万卡级容错恢复、NPU确定性计算、算力利用率提升等核心难题,验证了大规模国产训练的可行性。

发布于 山东