机器人不只要会动,更要会在物理世界中「想」!至简动力携手北大、港中文推出LaST-R1,让机器人「先想明白再下手」——仅靠1条轨迹预热RL就在LIBERO狂刷99.9%,真机任务从52.5%暴涨至93.75%,全面碾压SOTA。
LaST-R1 的意义在于:
具身大模型的 RL 后训练,不再只是让机器人更会动,而是让它更会理解为什么这样动。
当推理也能被环境反馈持续优化,机器人就不只是复现演示数据。
它开始在交互中形成自己的物理直觉。
这可能是具身大模型从「会模仿」走向「会思考行动」,也是走出实验室,走进千家万户的关键一步。
论文链接:
http://t.cn/AXi2SHN4
项目主页:
http://t.cn/AXi2SHNb
代码链接:
http://t.cn/AXi2SHNU
LaST₀具身基座模型首创Latent多模态思维链,将世界模型和具身模型对物理世界的推理与动作生成能力完美结合。
已被ICML2026选为Spotlight论文,并已成为北美顶尖实验室对比的Baseline(arxiv链接:
http://t.cn/AXi2SHNy)。
LaST-R1则是作为LaST₀基座模型的续作,提出具身大模型后训练的全新范式。
