量子位
26-06-11 08:49 微博认证:量子位官方微博

#小米最快1T大模型#全球大模型的军备竞赛,正在“智商”之外开辟新的战场——

推理速度。

把这个战场抬到新高度的,是小米。

小米发布了全新的MiMo-V2.5-Pro-UltraSpeed模型,也就是MiMo-V2.5-Pro的高速版本。

它拥有1T总参数,支持1M上下文,单API推理速度直接拉到1000+ TPS,刷新旗舰模型全球最快推理速度。

而且不像Groq那样依靠定制芯片,用通用GPU就能实现。

这也意味着,小米这次的新模型,打破了“快、强、通用GPU无法兼得”的行业不可能三角。小米秀出的是从模型层到引擎层的全链路推理优化能力,而背后的推理工程实力,毫无疑问是全球第一梯队水平。 http://t.cn/AXa76rbT