有点儿西东
26-06-01 11:50 微博认证:AI博主

MiniMax 发布首个原生多模态开源模型 MiniMax M3

刚刚,MiniMax 宣布推出 MiniMaxM3 模型,它是第一个把前沿编码能力、长上下文处理和原生多模态结合在一起的开源权重模型。

编码和智能体能力方面,M3 在多个基准测试中表现突出。在 SWE-Bench Pro 上达到 59.0 分。在 Terminal Bench 2.1 上达到 66.0 分。它还在 KernelBench Hard 上取得 28.8 分,在 MCP Atlas 上达到 74.2 分。和当前主流闭源模型相比,在实际开发工具使用和代码生成任务中表现稳定。

模型采用稀疏注意力机制,上下文长度可以扩展到 100 万 Token。这意味着它能处理大型代码库或者长文档,而不会丢失关键信息,这种设计让长上下文使用变得更高效。实际应用中,这对需要回顾大量上下文的场景很有帮助,比如长代码审查或多轮项目讨论。

M3 从训练开始就支持多模态。它可以直接处理图像、视频等输入,然后生成相应输出。特别适合需要视觉和文本结合的应用场景,比如分析截图后给出代码建议,或者处理视频内容后提取信息。

MiniMax 计划在约 10 天后发布模型权重和技术报告。目前用户可以通过 API 访问。输入价格为每百万 Token 0.60 美元,输出 2.40 美元。512K 上下文以内前 7 天有 50% 折扣。超过 512K 到 1M 的价格相应提高。

MiniMax M3 把「原生多模态 + 超长上下文 + 开源生态」第一次真正结合在一起。其他的开源模型更多是在「聊天」,而 M3 具备看图、理解视频、长链路推理以及 Agent 执行能力。

而 M3 如果达到预期,很可能会让行业进入下一阶段:开源多模态模型,开始正面挑战 OpenAI 和 Google 的核心护城河。

最强的 AI 能力,会不会最终都变成开源?

发布于 山东