MiniMax 又发模型了,这更新速度也太快了吧。
新模型是 M2.7,这是其首个深度参与迭代自身,自我进化的大模型。
来看几条关键点:
- 自主进化:能够自主跑通 100+ 轮优化迭代,使内部评测效果提升 30%,MLE Bench Lite 测试中胜率达 66.6%(追平 Gemini-3.1)。
- 软件工程:SWE-Pro 得分 56.22%(逼近 Opus 最高水平),端到端项目交付 VIBE-Pro 得分 55.6%,复杂系统理解 Terminal Bench 2 得分 57.0%,在实际线上生产环境排障中,将恢复时间缩短至 3分钟以内。
- 专业办公: GDPval-AA 的 ELO 得分达 1495-1500 梯队(目前开源最高),Toolathon 正确率 46.3%(全球第一梯队),MMClaw 正确率 62.7%(接近最新的Sonnet 4.6),在 >2000 Token 的复杂指令中保持 97% 遵循率(40 个复杂 skills),Office 三件套玩得非常6。
- 多智能体协作:将角色边界,对抗性推理,协议遵循,行为分化等范式,内化成模型原生能力。
- 开源了 AI 驱动的 Web GUI 交互空间 OpenRoom,通过对话驱动,实时产生视觉反馈与场景交互,角色可以主动地与环境交互。
- API 价格与 M2.5 保持一致,输入 2.1 元/百万 tokens,输出8.4 元/百万 tokens。
传送门:www.minimaxi.com/news/minimax-m27-zh
#HOW I AI##科技先锋官##minimax##minimaxm2.7#
发布于 北京
