#人工智能[超话]#2025年10月14日凌晨,蚂蚁集团正式推出万亿参数思考模型Ring-1T,并全面开源模型权重、训练配方 。该模型在多项任务中表现出色,综合能力逼近GPT-5 。
Ring-1T是在9月30日开源的预览版Ring-1T-preview基础上进行了优化,通过持续扩展大规模可验证奖励强化学习(RLVR)训练,进一步激发了万亿基座的自然语言推理能力,并结合人类反馈强化学习(RLHF)训练完善了模型通用能力,使其在各项任务榜单上的表现更加均衡 。
在“人类偏好对齐”测试Arena-Hard V2中,Ring-1T以81.59的成功率居于开源模型榜首,逼近GPT-5-Thinking(High)82.91的成绩 。在医疗问答专项测评HealthBench中,Ring-1T也以最高分取得开源领域最佳 。
此外,Ring-1T的数学推理能力也十分突出。蚂蚁百灵团队将其接入多智能体框架AWorld,使用纯自然语言推理来挑战IMO2025赛题 。结果显示,Ring-1T首次尝试就解出了第1、3、4、5题,达到IMO银牌水平,在第三次尝试时对第2题几何证明也给出了接近满分的证明过程 。
发布于 福建
