数字生命卡兹克 26-03-18 21:36
微博认证:AI博主

聊聊MiniMax M2.7,国产最佳的Agent基模。

今天下午,MiniMax突然就发了MiniMax 2.7模型,股价也涨了近20个点。

而且主打的点是:“M2.7是我们第一个深度参与自身进化的模型。”

路上感觉还是值得聊一下。

上个月OpenAI刚说GPT-5.3 Codex参与了自己的训练,现在Minimax也说M2.7参与了自己的进化。

感觉用AI造AI看来马上要成行业标配了。。。

不过MiniMax的技术报告相比OpenAI还是说了点东西的。

他们说在开发M2.7的过程中,用早期版本的模型构建了数十个复杂的Skills,更新模型自己的记忆,驱动模型自己的强化学习,还能根据结果优化强化学习的流程和框架。

在一些研发场景,M2.7现在能自己处理工作流的30%~50%,他们目标是未来的AI自我进化将逐步向完全自治转变,在数据构建、模型训练、推理架构、等等阶段,无需人工干预。

这个真的成熟以后,我感觉大厂就会真正的给一些算力做实验,那就真的成自进化了。。。

再说说模型的能力,我接了下M2.7简单试了试,还是有点惊喜的,比M2.5好了不少。

在覆盖多种编程语言的SWE-Pro上,M2.7达到 56.22%的准确率,跟GPT-5.3-Codex持平,这个其实很难得了,对复杂工程的理解也不错。

而且原生支持Agent Team,就是Claude Code的那个让多个Agent互相协同并行执行任务,这个确实还是国产模型里面一个比较难得的特性。

然后他们基于OpenClaw中常用的任务,构建了一个名为MM Claw的评估集,涵盖了工作和生活中广泛的真实需求,M2.7在该测试上达到了接近Sonnet 4.6的水平,准确率为 62.7%。

同时还有一个能力,是MiniMax最擅长的东西,就是角色一致性和可对话性,你懂的,今天他们也把一个新的东西叫OpenRoom开源了,在Agent娱乐这方面又搞出了新玩法,感兴趣的大佬可以去提提玩法,在Github上搜OpenRoom就行。

整体能力体验下来,感觉是目前国内最适合类似OpenClaw这种Agent的基座模型。

而且还有一个特点就是,真的便宜啊,又便宜又快。

M2.5的时候他们就做到了跑1小时只要1美元的成本,而M2.7在推理效率上还有提升,这个属实香炸了,20刀的Coding Plan就能用得非常爽。

所以,今天也更新一下我心中的Agent产品推荐。

如果你有用国外产品的条件:
最优解肯定是Claude Code 和Cowork + Claude Opus 4.6。

用不了的话就开发是Codex + GPT 5.4,通用办公OpenClaw + GPT 5.4。

如果你只能用国内产品:
目前Claude Code + MiniMax M2.7应该目前体验最好,其次就是OpenClaw + M2.7。

大概就是这样。
#AI超话##科技先锋官##HOW I AI##MiniMax#

发布于 北京