向大家汇报一个好消息!在采用双盲测试、由真实用户投票决出排名的Arena系列榜单里,小米MiMo-V2.5-Pro取得了一些好成绩:
📌 Text Arena (Expert) 模型排名 — 全球第六
Expert 榜单以高难度任务和专业用户投票著称,是衡量大模型核心智力的关键标尺。
MiMo-V2.5-Pro 在本次更新中跻身全球第六,也是榜单中排名第一的开源模型与国产模型。在实验室排名维度,小米排名全球第三,仅次于 Anthropic 和 OpenAI。
📌 Text Arena (Overall) 模型排名 — 全球开源第二
在涵盖数学、编程、创意写作等综合文本任务的 Overall 维度,MiMo-V2.5-Pro 位列全球开源模型第二。
📌 Code Arena (WebDev) 模型排名 — 全球开源第三
WebDev Arena 由社区盲投票评选优胜,考察的是真实场景下的前端代码生成能力。
MiMo-V2.5-Pro 在该维度跻身全球开源前三。
📌 Text Arena 四项子榜单 — 全球开源第一
在困难任务、英文困难任务、指令遵循、长文任务四个子维度中,MiMo-V2.5-Pro 均位列全球开源模型第一。
发布于 北京
