波士顿动力最新演示，使用动作捕捉服开发的强化学习策略，太丝滑了。该工作由波士顿动力与 RAI 研究所共同完成。强化学习过程的核心是一个基于物理的模拟器，它为各种动作生成训练数据。控制策略跟踪并控制重新定向的人类运动数据。每个动作都是通过约 1.5 亿次模拟器运行的数据创建的，并零样本

波士顿动力最新演示，使用动作捕捉服开发的强化学习策略，太丝滑了。

该工作由波士顿动力与 RAI 研究所共同完成。

强化学习过程的核心是一个基于物理的模拟器，它为各种动作生成训练数据。控制策略跟踪并控制重新定向的人类运动数据。每个动作都是通过约 1.5 亿次模拟器运行的数据创建的，并零样本转移到硬件上。

http://t.cn/A6BOb3XE

发布于北京