科技Finder 26-02-12 13:10
微博认证:数码博主

#雷军公布小米机器人最新进展#
小米这个Xiaomi-Robotics-0实在太强了……

从架构创新方面,小米用了多模态VLM做“大脑”,负责理解人类指令和空间关系。用多层Diffusion Transformer(DiT)做“小脑”,生成高频、平滑的“动作块”,保证动作精准连贯。所以小米机器人才能既能“听懂话”,又能“动作灵”。

目前已经刷新了多项SOTA,真实场景表现非常亮眼。在主流仿真测试(如Libero、CALVIN、SimpleBench)中都取得了优异成绩。

在真实物理世界中,能在消费级显卡上实现实时推理,动作连贯、反应灵敏,完成叠积木、叠毛巾等复杂任务。注意是消费级显卡,展示视频我放下面了,实在太精准了。
#小米发布机器人基座模型#

发布于 中国