华尔街见闻APP 25-12-03 07:34
微博认证:华尔街见闻 网址 http://wallstreetcn.com/ 官方微博

【英伟达官宣新合作成就:#Mistral开源模型# 提速,任意规模均提高效率和精度】通过为大型先进混合专家模型(MoE)定制的优化技术,Mistral Large 3在英伟达GB200 NVL72系统上实现了同类最佳性能,相比前代H200芯片的性能提升10倍,每MW能耗可实现每秒超过500万token的处理速度。Ministral 3系列小模型在英伟达RTX 5090 GPU上可实现每秒最高385个token的推理速度。详见http://t.cn/AXyGgxmP