蚂蚁集团发布大模型实测

给大家带来蚂蚁集团 inclusionAI 团队的 Ring-2.5-1T & Ling-2.5-1T 大模型实测!

最近很多小伙伴问我是怎么第一时间知道大模型发布的, 秘密就是我用AI搞了一个爬虫平台, 帮我监控所有大模型厂商的 HuggingFace、GitHub、社交媒体页面, 有更新就自动通知我.

这个平台用到的正好就是蚂蚁集团 InclusionAI 团队刚发布的万亿参数大模型: Ring-2.5-1T (思考模型) 负责操作浏览器抓取信息, Ling-2.5-1T (非思考模型) 负责对比两次抓取内容判断是否有更新.

来看测试结论:

前端编程能力上 Ring-2.5-1T 会优于 Ling-2.5-1T 从建模精度, 逻辑细节, 粒子效果, 到一些图形学算法上均有不错的表现.

而 Ling-2.5-1T 的最大亮点则是指令遵循能力意外地强! 指令遵循测试中 6000 token 上下文、85个需求, 部分指令遵循达到 91.8%, 加权总分 8.2, 不输 SOTA 级别模型. 特别适合文本比对、内容抽取、修改文章这类需要精准遵循指令的场景.

Agent能力: 硅基骑手测试 Ling-2.5-1T 得分 180.48, Ring-2.5-1T 则达到 325.79, 思考模型在 Agent 任务上优势明显.

总结: Ling-2.5-1T 指令遵循是真的亮眼, 作为非思考模型响应速度快, 适合各种自动化任务和脚本. 需要更强编程和Agent能力就上 Ring-2.5-1T. 官方透露 2.6 版本不久后发布, 期待后训练能进一步加强!
#HOW I AI##Ling-2.5-1T##Ring-2.5-1T##蚂蚁集团##InclusionAI# http://t.cn/AXcQj80c

发布于北京