科技Finder 26-02-12 11:59
微博认证:数码博主

#雷军公布小米机器人最新进展#
小米机器人新动作!

小米刚刚开源了首代机器人VLA大模型Xiaomi-Robotics-0。拥有47亿参数、兼具视觉语言理解与高性能实时执行能力。

Xiaomi-Robotics-0 的强大之处主要体现在这几点:

用多模态VLM做“大脑”,负责理解人类指令和空间关系。用多层Diffusion Transformer(DiT)做“小脑”,生成高频、平滑的“动作块”,保证动作精准连贯。

引入Clean Action Prefix和A-shape Attention Mask,解决推理延迟导致的“动作断层”,让机器人反应更敏捷、运行更稳定。

在主流仿真测试(如Libero、CALVIN、SimpleBench)中取得优异成绩。在真实物理世界中,能在消费级显卡上实现实时推理,动作连贯、反应灵敏,完成叠积木、叠毛巾等复杂任务。

同时模型和技术全开源,让更多开发者和企业能快速复用,加速具身智能从实验室走向现实应用。
#小米发布机器人基座模型#

发布于 中国