新智元 26-05-11 11:26
微博认证:新智元官方微博

机器人不只要会动,更要会在物理世界中「想」!至简动力携手北大、港中文推出LaST-R1,让机器人「先想明白再下手」——仅靠1条轨迹预热RL就在LIBERO狂刷99.9%,真机任务从52.5%暴涨至93.75%,全面碾压SOTA。

LaST-R1 的意义在于:

具身大模型的 RL 后训练,不再只是让机器人更会动,而是让它更会理解为什么这样动。

当推理也能被环境反馈持续优化,机器人就不只是复现演示数据。

它开始在交互中形成自己的物理直觉。

这可能是具身大模型从「会模仿」走向「会思考行动」,也是走出实验室,走进千家万户的关键一步。

论文链接:
http://t.cn/AXi2SHN4

项目主页:
http://t.cn/AXi2SHNb

代码链接:
http://t.cn/AXi2SHNU

LaST₀具身基座模型首创Latent多模态思维链,将世界模型和具身模型对物理世界的推理与动作生成能力完美结合。

已被ICML2026选为Spotlight论文,并已成为北美顶尖实验室对比的Baseline(arxiv链接:
http://t.cn/AXi2SHNy)。

LaST-R1则是作为LaST₀基座模型的续作,提出具身大模型后训练的全新范式。