i陆三金
25-03-18 01:23 微博认证:AI博主

Gemma 3 最佳开源轻量级模型的屁股还没坐稳,Mistral Small 3.1 就来掀桌子了。

Mistral Small 3.1 基于 Mistral Small 3,3.1 在文本性能、多模态理解和上下文窗口扩展至 128k tokens 方面均有提升。该模型在推理速度达到每秒 150 tokens 的同时,性能超越了 Gemma 3 和 GPT-4o Mini 等同类模型。

Mistral Small 3.1 基于 Apache 2.0 许可证发布。

Mistral Small 3.1 本次发布了预训练基础模型和 Instruct 模型。

特性:
- Mistral Small 3.1 可在单张 RTX 4090 或配备 32GB RAM 的 Mac 上运行
- 快速响应的对话辅助:非常适合虚拟助手及其他需要快速、准确响应的应用场景。
- 低延迟函数调用:能够在自动化或 agentic 工作流中快速执行函数
- 针对专业领域的微调:Mistral Small 3.1 可以进行微调,以专注于特定领域,从而创建准确的主题专家。这在法律咨询、医疗诊断和技术支持等领域尤为有用。
- 高级推理基础:过去几周,有多个基于 Mistral Small 3 构建的优秀推理模型推出,因此 Mistral 发布了 Mistral Small 3.1 的基础版和 Instruct 版检查点,以支持该模型的进一步下游定制。

Hugging Face 页面

基础模型:http://t.cn/A6BKSE1V

Instruct 模型:http://t.cn/A6BKSE1f

发布于 北京