i陆三金
25-03-19 22:58 微博认证:AI博主

波士顿动力最新演示,使用动作捕捉服开发的强化学习策略,太丝滑了。

该工作由波士顿动力与 RAI 研究所共同完成。

强化学习过程的核心是一个基于物理的模拟器,它为各种动作生成训练数据。控制策略跟踪并控制重新定向的人类运动数据。每个动作都是通过约 1.5 亿次模拟器运行的数据创建的,并零样本转移到硬件上。

http://t.cn/A6BOb3XE ​​​

发布于 北京