MiniMax发布M3模型

MiniMax 发布首个原生多模态开源模型 MiniMax M3

刚刚，MiniMax 宣布推出 MiniMaxM3 模型，它是第一个把前沿编码能力、长上下文处理和原生多模态结合在一起的开源权重模型。

编码和智能体能力方面，M3 在多个基准测试中表现突出。在 SWE-Bench Pro 上达到 59.0 分。在 Terminal Bench 2.1 上达到 66.0 分。它还在 KernelBench Hard 上取得 28.8 分，在 MCP Atlas 上达到 74.2 分。和当前主流闭源模型相比，在实际开发工具使用和代码生成任务中表现稳定。

模型采用稀疏注意力机制，上下文长度可以扩展到 100 万 Token。这意味着它能处理大型代码库或者长文档，而不会丢失关键信息，这种设计让长上下文使用变得更高效。实际应用中，这对需要回顾大量上下文的场景很有帮助，比如长代码审查或多轮项目讨论。

M3 从训练开始就支持多模态。它可以直接处理图像、视频等输入，然后生成相应输出。特别适合需要视觉和文本结合的应用场景，比如分析截图后给出代码建议，或者处理视频内容后提取信息。

MiniMax 计划在约 10 天后发布模型权重和技术报告。目前用户可以通过 API 访问。输入价格为每百万 Token 0.60 美元，输出 2.40 美元。512K 上下文以内前 7 天有 50% 折扣。超过 512K 到 1M 的价格相应提高。

MiniMax M3 把「原生多模态 + 超长上下文 + 开源生态」第一次真正结合在一起。其他的开源模型更多是在「聊天」，而 M3 具备看图、理解视频、长链路推理以及 Agent 执行能力。

而 M3 如果达到预期，很可能会让行业进入下一阶段：开源多模态模型，开始正面挑战 OpenAI 和 Google 的核心护城河。

最强的 AI 能力，会不会最终都变成开源？

发布于山东