小米MiMo-V2.5-Pro-UltraSpeed正式发布,在通用 GPU 上将万亿参数模型的生成速度首次突破 1000 tokens/s。
从4月份MiMo-V2.5-Pro跻身全球开源并列第一,5月宣布推理优化实现全面调价,再到如今刷新全球最快推理速度,小米MiMo一个半月三次关键突破,推理工程能力真正跻身全球第一梯队!
http://t.cn/AXXBy56S
发布于 北京
小米MiMo-V2.5-Pro-UltraSpeed正式发布,在通用 GPU 上将万亿参数模型的生成速度首次突破 1000 tokens/s。
从4月份MiMo-V2.5-Pro跻身全球开源并列第一,5月宣布推理优化实现全面调价,再到如今刷新全球最快推理速度,小米MiMo一个半月三次关键突破,推理工程能力真正跻身全球第一梯队!
http://t.cn/AXXBy56S