驱动中国官方
26-06-30 15:34 微博认证:驱动中国官方微博

#美团开源国产算力万亿大模型LongCat-2.0#美团今日正式推出万亿参数大模型 LongCat-2.0,该模型后续全面对外开放开源。

它是业内首个依托五万卡国产算力集群完成完整训推的万亿级模型,总参数 1.6T,动态激活区间 33B~56B,原生支持 100 万 Token 超长上下文,从零完成预训练。此前预览版已上线 OpenRouter 与 longcat.ai,平台调用量稳居全球前三,在 Hermes、Claude Code、OpenClaw 榜单分别拿下第一、第二名。

模型预训练数据超 30T tokens,覆盖多语种、代码类素材;团队从稳定、准确、效率三方面解决国产万卡集群训练痛点:优化故障处理机制让月均日故障率下降七成以上,自研算子保障训练结果精准,多重调度优化使训练 MFU 提升 1.5 倍,稳定日输出超 1T tokens。

推理端完成多维度优化,搭载自研 LSA 稀疏注意力,长文本计算从平方级降至线性;依托零计算专家实现 token 动态算力分配,简单任务少占用资源、复杂任务自动扩容;MOPD 架构划分三大专家模块,门控网络按需调度,兼顾代码、推理、交互各类任务。

实测评测成绩亮眼:编程赛道 SWE-bench Pro 得分 59.5,超越 GPT-5.5、Gemini 3.1 Pro;多语言代码、终端运维评测表现稳定;办公智能体 RWSearch、FORTE、BrowseComp 三项打分均逼近主流闭源模型,适配企业智能体落地场景。

发布于 陕西