好家伙,小米深夜发布,MiMo-V2.5 系列(含 V2.5、Pro、TTS、ASR)开启公测,且即将开源。
我米的进化速度太快了!!!已经迫不及待实测了,咱们先来过一下重点信息:
1、MiMo-V2.5-Pro 在通用智能体能力,复杂软件工程及长程任务等维度上,已经能够与全球顶尖 Agent 模型(Claude Opus 4.6、GPT-5.4)正面掰手腕。
2、把需要人类专家数天乃至数周才能完成的任务,交给 MiMo-V2.5-Pro 独立跑完长程,可以保持极高质量。
其中一个任务是用 Rust 从零实现完整的 SysY 编译器,源自北大《编译原理》课程项目,作为参考,北大本科生完成需要数周时间,MiMo-V2.5-Pro 仅用了 4.3 小时,经过 672 次工具调用,在隐藏测试集上取得 233/233 的满分。
另外一个任务是视频编辑器开发,仅凭简单的几句提示词,最终交付了一款可实际运行的 Web 应用,具备多轨道时间线,片段剪辑,交叉淡化,音频混合和导出等全流程功能。代码量达近万行,经历 1868 次工具调用,用时 11.5 小时,整个过程全自主完成。
3、MiMo-V2.5 的有两个关键的升级:Agent 能力全面超越 Mimo-V2-Pro,同时 API 成本降低约一半。多模态感知全面超越 MiMo-V2-Omini,其中跨模态推理,视频理解,图表分析等能力,逼近甚至超越业界顶级闭源模型。
4、MiMo-V2.5 全系具有更高的 Token 效率。在同样的基准分数下,MiMo-V2.5-Pro 相比 Kimi K2.6 节省了 42% Token。MiMo-V2.5 相比 Muse Spark 节省了 50% Token。
5、Token Plan 也升级了,诚意拉满。不再区分上下文窗口大小,老用户用量重置,夜间专属优惠等,详情见最后一张图。
#HOW I AI##科技先锋官##小米#
