i陆三金
26-06-09 16:16 微博认证:AI博主

终于还是用上了 MiMo-V2.5-Pro-UltraSpeed

这速度简直了,录个屏展示一下。

给了它一个长段的提示词,让它开发个挂机 RPG,48秒时间就写了1000多行代码,其中思考时间还花掉了一半,感觉特别急切地想要完成我的任务[捂嘴哭]

底部的速度栏还能实时展示速度,在我的案例中,思考时的速度大概是在 600tokens/s,干活时直接飙到 1000 tokens/s 上下,符合小米所说的 1000tokens/s的速度。

1000 tokens/s 并不稀奇,但是万亿参数的 1000 tokens/s,这就很厉害了。

小米是第一家把万亿参数模型做到 1000 tokens/s 输出速度的。

果然还得是小米,把天下武功,唯快不破,应用到大模型上了#小米大模型刷新全球最快推理速度# http://t.cn/AXXr4sOC

发布于 北京