雷军 26-03-31 13:31
微博认证:小米创办人,董事长兼CEO;金山软件董事长;天使投资人。

大模型权威评测榜单Text Arena,该榜单独有的“双盲测试”机制——即模型身份完全隐藏、由全球真实用户基于回答质量进行即时投票,杜绝了传统评测中常见的“针对数据集刷榜”行为。

MiMo-V2-Pro 凭借在复杂逻辑推理、长指令遵循及多轮对话中的稳定表现,Model Rank 维度,排在全球第五。同时,在衡量实验室综合研发实力的LabRank(实验室排名)维度,Text Arena (ArenaExpert) 小米排全球第四,Code Arena 小米排全球第五。

发布于 北京