🎈 美团发布新一代万亿参数大模型 LongCat-2.0,架构设计始终围绕一个核心目标:让模型在真实 Agentic Coding 任务中更高效、更稳定地完成代码理解、生成与执行。
📌 1M超长上下文,让 Agent 看见整个项目。LongCat-2.0 采用 LongCat Sparse Attention(LSA)稀疏注意力机制,在处理长文本时不再“逐字逐句地看”,而是智能筛选关键信息,将计算量从平方级降至线性级。这使得模型在 100 万 Token 的超长上下文中,依然保持精准的信息定位与理解能力。
📌 零计算专家 + ScMoE,让算力用在刀刃上。代码任务中不同 token 复杂度差异巨大——定义变量名和推导递归算法对算力的需求完全不同。LongCat-2.0 通过零计算专家实现 token 级动态激活(33B~56B),简单 token 不消耗算力,复杂 token 自动获得更多计算资源。
📌 MOPD 多专家融合,一个模型同时擅长写代码、做推理、懂交互。 LongCat-2.0 通过 MOPD 架构融合 Agent、Reasoning、Interaction 三组专家能力——Agent Experts 专攻工具调用与自主纠错,Reasoning Experts 深耕数学与 STEM 推理,Interaction Experts 优化指令遵循与交互体验。
LongCat-2.0 通过精细的架构设计,让万亿参数模型在实际任务中更高效、更稳定地发挥能力。
欢迎大家体验:http://t.cn/AXPwc5Ly 🔥🔥🔥 #How I AI#、 #AI#、#大模型#
发布于 北京
