不吃西梅的林娜
26-06-09 12:36 微博认证:数码博主

今天,小米MiMo-V2.5-Pro-UltraSpeed,在通用GPU上让万亿参数模型的生成速度突破了1000 tokens/s。这不是简单的“更快”,而是让AI从等待的“静态”走向了思考的“动态”,它让实时决策、高频交互,乃至医疗影像分析等生命攸关的场景,迎来了真正的变革。

从FP4量化到DFlash解码,再到TileRT超延迟推理内核,每一项技术都指向同一个目标:在通用硬件上,释放出不逊于专用芯片的极限性能。
#小米[超话]##小米##小米发布最新mimo大模型#
http://t.cn/AXXBKzBL

发布于 广东