2025年9月30日凌晨,蚂蚁集团开源了自研的首个万亿参数大模型Ring-1T-preview。
这是一款自然语言推理大模型,也是全球首个开源的万亿参数推理大模型,标志着蚂蚁集团加入万亿参数大模型阵营,打破了此前国外闭源巨头对万亿级模型技术的相对垄断。
在考察数学能力的AIME 25测试Ring-1T-preview取得92.6分,超越所有已知开源模型及Gemini 2.5 Pro,接近GPT-5(无工具使用)的94.6分。在CodeForces测试中斩获94.69分,超过GPT-5。同时,在LiveCodeBench及ARC-AGI-v1等权威榜单中,该模型均位列开源模型首位。
采用MoE(混合专家系统)架构,通过“1.2万亿参数+16专家层”的配置实现性能与效率的平衡。推理阶段支持“双模式切换”,处理简单任务时仅激活1-2个专家层,响应时间小于100毫秒;面对复杂任务时全量调用专家层,准确率可提升30%。
- 相关技术成果融合:深度融合了蚂蚁AGI团队的诸多先进研发成果,如全新升级的Ling-2.0 MoE架构,融合了1/32稀疏性、FP8混合精度训练等特性,训练效率和性能都显著增强。还包括棒冰(icepop)方法,克服了MoE LLM强化学习训练中的稳定性挑战,以及自研高效强化学习系统ASystem等。
蚂蚁同步推出Ring-Inference推理引擎,支持单GPU部署万亿参数模型的轻量化推理,将推理延迟降低40%,为模型的应用提供了更好的支持,有助于企业级场景落地。#互联网科技# http://t.cn/AX7pttjj
发布于 福建
