小米机器人开源VLA大模型

#雷军公布小米机器人最新进展#
小米机器人新动作！

小米刚刚开源了首代机器人VLA大模型Xiaomi-Robotics-0。拥有47亿参数、兼具视觉语言理解与高性能实时执行能力。

Xiaomi-Robotics-0 的强大之处主要体现在这几点：

用多模态VLM做“大脑”，负责理解人类指令和空间关系。用多层Diffusion Transformer（DiT）做“小脑”，生成高频、平滑的“动作块”，保证动作精准连贯。

引入Clean Action Prefix和A-shape Attention Mask，解决推理延迟导致的“动作断层”，让机器人反应更敏捷、运行更稳定。

在主流仿真测试（如Libero、CALVIN、SimpleBench）中取得优异成绩。在真实物理世界中，能在消费级显卡上实现实时推理，动作连贯、反应灵敏，完成叠积木、叠毛巾等复杂任务。

同时模型和技术全开源，让更多开发者和企业能快速复用，加速具身智能从实验室走向现实应用。
#小米发布机器人基座模型#

发布于中国