凌晨,小米 MiMo-V2.5 系列开启公测。最让人意外的是,官方直接点名 Claude Opus 4.6 和 GPT-5.4。
---
🔍 4.3 小时,写完一个完整编译器
北大《编译原理》课程项目,本科生要数周完成。MiMo-V2.5-Pro 用时 4.3 小时,672 次工具调用,隐藏测试集 233/233 满分。首次编译就通过 59% 的测试,意味着架构一开始就是对的。第 512 轮一次重构导致回退,模型自行诊断、恢复、继续推进。
---
💻 11.5 小时,独立开发视频编辑器
只给一句指令:"构建一个视频编辑器 Web 应用"。最终交付 8,192 行代码,多轨道时间线、片段裁剪、音频混合全有。1,868 次工具调用,连续工作 11.5 小时不出错。不是 demo,是真能干活的。
---
💰 同样的活,少花一半的钱
同样跑 Agent 任务,V2.5-Pro 比 Kimi K2.6 省 42% Token,V2.5 比 Muse Spark 省 50% Token。每天跑 API 的开发者,花的钱少了将近一半。
---
🌙 熬夜写代码的人有福了
每天 00:00-08:00,所有模型 Credits 消耗再打 8 折。已购买 Token Plan 的用户,Credits 额度全部重置清零。V2.5-Pro 和 V2.5 即将全球开源,可以本地部署自己调。
---
#小米##MiMoV25##AI大模型##Claude##GPT#
发布于 北京
