#小米大模型刷新全球最快推理速度# MiMo 团队与 TileRT 团队联合发布了MiMo-V2.5-Pro的UltraSpeed模式,在通用GPU集群上将万亿(1T)参数模型的推理生成速度首次突破1000 tokens/s,最高可达约1200 tokens/s。
这是全球最快推理速度没有之一,Agent生产力真正进入不用等时代,以前等模型出结果的时间够泡杯咖啡,现在人还没端起杯子它就跑完了。
MiMo 团队在这个安静的赛道上可谓一路狂奔,1000tokens/s不稀奇,万亿参数模型也不稀奇,但是万亿参数跑出1000tokens/s,目前全球独此一家,全球最快的万亿参数旗舰模型,含金量和小模型不是一个量级。
不仅如此,token费用是另一大优势,UltraSpeed定价是普通V-2.5-Pro的三倍,但用起来速度和体验直接拉满十倍,现在毫秒级响应,Agent终于能像人一样流畅干活了,效率起飞! http://t.cn/AXaAUlvC
发布于 广东
