波士顿动力最新演示,使用动作捕捉服开发的强化学习策略,太丝滑了。
该工作由波士顿动力与 RAI 研究所共同完成。
强化学习过程的核心是一个基于物理的模拟器,它为各种动作生成训练数据。控制策略跟踪并控制重新定向的人类运动数据。每个动作都是通过约 1.5 亿次模拟器运行的数据创建的,并零样本转移到硬件上。
http://t.cn/A6BOb3XE
发布于 北京
波士顿动力最新演示,使用动作捕捉服开发的强化学习策略,太丝滑了。
该工作由波士顿动力与 RAI 研究所共同完成。
强化学习过程的核心是一个基于物理的模拟器,它为各种动作生成训练数据。控制策略跟踪并控制重新定向的人类运动数据。每个动作都是通过约 1.5 亿次模拟器运行的数据创建的,并零样本转移到硬件上。
http://t.cn/A6BOb3XE