聊聊MiniMax M2.7,国产最佳的Agent基模。
今天下午,MiniMax突然就发了MiniMax 2.7模型,股价也涨了近20个点。
而且主打的点是:“M2.7是我们第一个深度参与自身进化的模型。”
路上感觉还是值得聊一下。
上个月OpenAI刚说GPT-5.3 Codex参与了自己的训练,现在Minimax也说M2.7参与了自己的进化。
感觉用AI造AI看来马上要成行业标配了。。。
不过MiniMax的技术报告相比OpenAI还是说了点东西的。
他们说在开发M2.7的过程中,用早期版本的模型构建了数十个复杂的Skills,更新模型自己的记忆,驱动模型自己的强化学习,还能根据结果优化强化学习的流程和框架。
在一些研发场景,M2.7现在能自己处理工作流的30%~50%,他们目标是未来的AI自我进化将逐步向完全自治转变,在数据构建、模型训练、推理架构、等等阶段,无需人工干预。
这个真的成熟以后,我感觉大厂就会真正的给一些算力做实验,那就真的成自进化了。。。
再说说模型的能力,我接了下M2.7简单试了试,还是有点惊喜的,比M2.5好了不少。
在覆盖多种编程语言的SWE-Pro上,M2.7达到 56.22%的准确率,跟GPT-5.3-Codex持平,这个其实很难得了,对复杂工程的理解也不错。
而且原生支持Agent Team,就是Claude Code的那个让多个Agent互相协同并行执行任务,这个确实还是国产模型里面一个比较难得的特性。
然后他们基于OpenClaw中常用的任务,构建了一个名为MM Claw的评估集,涵盖了工作和生活中广泛的真实需求,M2.7在该测试上达到了接近Sonnet 4.6的水平,准确率为 62.7%。
同时还有一个能力,是MiniMax最擅长的东西,就是角色一致性和可对话性,你懂的,今天他们也把一个新的东西叫OpenRoom开源了,在Agent娱乐这方面又搞出了新玩法,感兴趣的大佬可以去提提玩法,在Github上搜OpenRoom就行。
整体能力体验下来,感觉是目前国内最适合类似OpenClaw这种Agent的基座模型。
而且还有一个特点就是,真的便宜啊,又便宜又快。
M2.5的时候他们就做到了跑1小时只要1美元的成本,而M2.7在推理效率上还有提升,这个属实香炸了,20刀的Coding Plan就能用得非常爽。
所以,今天也更新一下我心中的Agent产品推荐。
如果你有用国外产品的条件:
最优解肯定是Claude Code 和Cowork + Claude Opus 4.6。
用不了的话就开发是Codex + GPT 5.4,通用办公OpenClaw + GPT 5.4。
如果你只能用国内产品:
目前Claude Code + MiniMax M2.7应该目前体验最好,其次就是OpenClaw + M2.7。
大概就是这样。
#AI超话##科技先锋官##HOW I AI##MiniMax#
