42号电波
26-07-02 11:42 微博认证:AI博主

先玩后精,这路子有点东西,cool!

Sharpa 提出 Play2Perfect 强化学习框架,先让机器人在仿真里「玩」,随便抓、随便转、随便够,把各种基础操作练成本能,再拿这些「玩耍经验」去学精密装配,样本效率能直接涨 33 倍。并且零样本迁移真机后,0.5mm 间隙插拔成功率 60%,多零件组装和拧螺丝也能超过 50%。组装时就算抓滑了,也能自己调整继续干。

#Sharpa##Play2Perfect##具身智能#

发布于 上海