Coding 之外,MiniMax 在悄悄做另一件事。
我发现 MiniMax M3 在金融场景里的效果非常好,这还是我同事前两天偶然发现的。说实话,我一开始有点惊讶。
因为他们在发布报告里,只是轻描淡写提了一句。大概意思是,M3 在金融领域已经达到了初步可用状态,然后就没有展开了。
这段时间,大家讨论 MiniMax M3 时,注意力其实更多集中在 Coding 上。
无论是做长程任务、提升代码能力,还是探索各种交互方式,包括基于多模态生成更好、更酷炫的页面,大家聊来聊去,基本都围绕这些方向展开。
这也正常。Coding 现在就是 AI 模型最重要的战场之一,所有模型都会往这个方向重点优化。
因为 Coding 本质上是在同时考验模型的需求理解、代码生成、错误定位、任务拆解以及长链路协作能力,所以它已经逐渐成了大家观察模型综合水平的一个核心指标。
但这里面其实有一个很容易被忽略的问题。
一个模型在 Coding 上做得好,不代表它在所有知识工作里都会自然变强。
比如 Anthropic 的 4.8 和 4.6 相比,Coding 能力肯定是变强了,但写作的能力是在变差的。http://t.cn/AXaTHP5t
发布于 北京
