爱可可-爱生活
26-06-27 05:27 微博认证:AI博主 2025微博新锐新知博主

[RO]《CoStream: Composing Simple Behaviors for Generalizable Complex Manipulation》H Chen, Y Ma, S Tian, X Han… [Stanford University & Harvard University & MIT] (2026)

在高精度且高频接触的机器人操作领域(如组装 GPU),实现毫米级精度与跨任务通用性的平衡是一个悬而未决的难题。过去的方法受困于经典模块化流水线的僵化或端到端策略对数据的极度饥渴,本质原因是它们将复杂操作视为不可分割的整体,无法灵活解耦与重组。

本文的核心洞见是:把复杂的操控能力重新看作是多个简单、独立行为的异步组合。由此,通过一个共享的 SE(3) 接口,将语义定位、视频预测的运动先验与高频触觉反馈进行右乘融合,这一关键操作使机器人能像人类一样,在保持全局目标的同时通过触觉实时修正亚毫米级的偏差。

这项工作真正留下的遗产是证明了复杂行为可以从简单行为的物理组合中自然涌现,无需针对新任务重新训练。它为后来者打开的新门是利用基础模型生成运动先验并配合闭环触觉执行精密任务,但尚未跨过的门槛是处理非刚性物体以及在缺乏触觉覆盖的盲区进行复杂交互。

arxiv.org/abs/2606.26423 #机器学习# #人工智能# #论文# #AI创造营#

发布于 北京