小米发布机器人基座模型

#雷军公布小米机器人最新进展##小米发布机器人基座模型#
就在刚刚，我米技术对外发布开源VLA模型Xiaomi-Robotics-0，该模型有47亿参数，兼具视觉语言理解与高性能实时执行能力，刷新多项SOTA。

采用MoT架构，大脑VLM理解人类指令、捕捉空间关系，小脑Action Expert生成平滑动作，训练上采用两阶段法，先跨模态预训练，再后训练，解决真机动作断层等问题。

在测试中，在仿真测试和现实真机任务中表现优异，保持了VLM多模态理解能力，将模型开源，有望推动机器人在工业、服务业、家庭等场景的应用，加速具身智能落地，相信很快就会运用在更多的生态产品上。

而Xiaomi-Robotics-0机器人基座模型，Benchmark全面超越OpenVLA和Pi，跻身行业第一梯队，结合近期Mimo等成果，我米AI成长迅猛，且开源VLA与触觉模型，构建完整手脑技术栈，务实推进，为机器人商用铺路。

发布于广东