Minimax M3开源_新浪新闻

Minimax M3开源了，是个428B的MoE模型，激活参数23B。
这个模型的神鬼二象性有点高。

我的token plan是29块钱/月，订阅的早，是相当于无限使用的那一波。
所以这阵子用这个模型用的有点多，但一直觉得手感有点奇怪，今天跑了几个任务大体可以这么形容：
这个模型的神鬼二象性有点高。

同样的Prompt、同样的Skill、同样的环境、同样的时间，一个结果像DeepSeek V4 Pro认真发挥，一个结果像7B模型的胡言乱语。
同样做一个深度研究，能给出一份幻觉巨多，连数字都全文是中文数字，而非阿拉伯数字的报告；也能给出一份比例颇强、研究老道的报告。

但我平时又写报告多，这个模型的工具调用，比deepseek要积极很多，且调用正确率还算高，外加TRAE可以无线白嫖字节的，卖3分钱一次的搜索API，所以目前用下来做深度研究，最方便的就是这个模型。
虽然神鬼二象性过于明显，但是鬼一次以后，我重新做一遍不就得了。

用起来是真的不心疼，多模态能力还过得去，我token还无限。
很有意思，很奇怪的一个模型，可能是后训练还没做够，希望他们M3.1能做得更好。

发布于北京