Minimax M3开源了,是个428B的MoE模型,激活参数23B。
这个模型的神鬼二象性有点高。
我的token plan是29块钱/月,订阅的早,是相当于无限使用的那一波。
所以这阵子用这个模型用的有点多,但一直觉得手感有点奇怪,今天跑了几个任务大体可以这么形容:
这个模型的神鬼二象性有点高。
同样的Prompt、同样的Skill、同样的环境、同样的时间,一个结果像DeepSeek V4 Pro认真发挥,一个结果像7B模型的胡言乱语。
同样做一个深度研究,能给出一份幻觉巨多,连数字都全文是中文数字,而非阿拉伯数字的报告;也能给出一份比例颇强、研究老道的报告。
但我平时又写报告多,这个模型的工具调用,比deepseek要积极很多,且调用正确率还算高,外加TRAE可以无线白嫖字节的,卖3分钱一次的搜索API,所以目前用下来做深度研究,最方便的就是这个模型。
虽然神鬼二象性过于明显,但是鬼一次以后,我重新做一遍不就得了。
用起来是真的不心疼,多模态能力还过得去,我token还无限。
很有意思,很奇怪的一个模型,可能是后训练还没做够,希望他们M3.1能做得更好。
发布于 北京
