Gemma 3 最佳开源轻量级模型的屁股还没坐稳，Mistral Small 3.1 就来掀桌子了。Mistral Small 3.1 基于 Mistral Small 3，3.1 在文本性能、多模态理解和上下文窗口扩展至 128k tokens 方面均有提升。该模型在推理速度达到每秒 150 tokens 的同时，性能超越了 Gemma 3 和 GPT-4o Mini 等同类模型。M

Gemma 3 最佳开源轻量级模型的屁股还没坐稳，Mistral Small 3.1 就来掀桌子了。

Mistral Small 3.1 基于 Mistral Small 3，3.1 在文本性能、多模态理解和上下文窗口扩展至 128k tokens 方面均有提升。该模型在推理速度达到每秒 150 tokens 的同时，性能超越了 Gemma 3 和 GPT-4o Mini 等同类模型。

Mistral Small 3.1 基于 Apache 2.0 许可证发布。

Mistral Small 3.1 本次发布了预训练基础模型和 Instruct 模型。

特性：
- Mistral Small 3.1 可在单张 RTX 4090 或配备 32GB RAM 的 Mac 上运行
- 快速响应的对话辅助：非常适合虚拟助手及其他需要快速、准确响应的应用场景。
- 低延迟函数调用：能够在自动化或 agentic 工作流中快速执行函数
- 针对专业领域的微调：Mistral Small 3.1 可以进行微调，以专注于特定领域，从而创建准确的主题专家。这在法律咨询、医疗诊断和技术支持等领域尤为有用。
- 高级推理基础：过去几周，有多个基于 Mistral Small 3 构建的优秀推理模型推出，因此 Mistral 发布了 Mistral Small 3.1 的基础版和 Instruct 版检查点，以支持该模型的进一步下游定制。

Hugging Face 页面

基础模型：http://t.cn/A6BKSE1V

Instruct 模型：http://t.cn/A6BKSE1f

发布于北京