小米发布Mimo大模型

今天，小米MiMo-V2.5-Pro-UltraSpeed，在通用GPU上让万亿参数模型的生成速度突破了1000 tokens/s。这不是简单的“更快”，而是让AI从等待的“静态”走向了思考的“动态”，它让实时决策、高频交互，乃至医疗影像分析等生命攸关的场景，迎来了真正的变革。

从FP4量化到DFlash解码，再到TileRT超延迟推理内核，每一项技术都指向同一个目标：在通用硬件上，释放出不逊于专用芯片的极限性能。
#小米[超话]##小米##小米发布最新mimo大模型#
http://t.cn/AXXBKzBL

发布于广东