大模型评测榜单排名刷新

向大家汇报一个好消息！在采用双盲测试、由真实用户投票决出排名的Arena系列榜单里，小米MiMo-V2.5-Pro取得了一些好成绩：

📌 Text Arena (Expert) 模型排名 — 全球第六
Expert 榜单以高难度任务和专业用户投票著称，是衡量大模型核心智力的关键标尺。
MiMo-V2.5-Pro 在本次更新中跻身全球第六，也是榜单中排名第一的开源模型与国产模型。在实验室排名维度，小米排名全球第三，仅次于 Anthropic 和 OpenAI。

📌 Text Arena (Overall) 模型排名 — 全球开源第二
在涵盖数学、编程、创意写作等综合文本任务的 Overall 维度，MiMo-V2.5-Pro 位列全球开源模型第二。

📌 Code Arena (WebDev) 模型排名 — 全球开源第三
WebDev Arena 由社区盲投票评选优胜，考察的是真实场景下的前端代码生成能力。
MiMo-V2.5-Pro 在该维度跻身全球开源前三。

📌 Text Arena 四项子榜单 — 全球开源第一
在困难任务、英文困难任务、指令遵循、长文任务四个子维度中，MiMo-V2.5-Pro 均位列全球开源模型第一。

发布于北京