(图1) 小米MiMo-V2.5-Pro以1579分登入开源模型榜第一,这个榜单用的是Stirrup Agent Harness框架实测,在真实工作任务中的表现超过了DeepSeek V4、GLM-5.1等热门开源模型。
国产模型占据了榜单前半段的大半江山,DeepSeek、MiniMax、Kimi等模型也都表现亮眼;
(图2)GDPval-AA最新全模型排行榜中,基于Stirrup Agent Harness的实测,聚焦AI在真实世界知识工作任务里的代理能力,直接用ELO分量化模型的“实用生产力”。
OpenAI的GPT-5.5(xhigh)、Anthropic的Claude Opus 4.7依旧稳居前列,而小米的MIMO-V2.5-Pro冲进了前五,拿下1579分,在一众头部模型里表现相当亮眼。
#小米[超话]##小米#
发布于 广东
