陳龍龖龘 25-11-26 17:04
微博认证:AI博主

我们正式发布并开源自动驾驶和机器人统一的「小米具身基座模型 MiMo-Embodied」

人类之所以能无缝切换于「厨房做饭」、「客厅整理」和「道路驾驶」,是因为我们依赖同一套对空间、物体和动态的通用理解能力。真正的 AI 也应当具备这种通用的空间推理能力。 如果机器人🤖和自动驾驶🚗都在解决感知、理解和预测的问题,那么它们本质应该共享同一个“物理世界的认知大脑🧠”。

我们利用多阶段预训练、思维链 (CoT) 及强化学习 (RL) 微调,验证了一个核心发现:自动驾驶与机器人的数据存在强大的「正向迁移」和「相互强化」效果。
实验结果验证:
1️⃣ 在自动驾驶和机器人的 29 个基准测试中达到 SOTA;
2️⃣ 通用视觉语言能力得以保留;
3️⃣ 成功验证了“统一具身智能大脑”的可行性。
这是迈向通用物理智能Physical AI的重要一步,更是为小米「人车家全生态」注入的核心技术动能!

💻 技术报告 & 代码 & 模型现已全量开源,地址见评论区,欢迎技术同仁共同探索!
#ai创造营##小米汽车##具身智能#

发布于 上海