【#加州大学# 研发机器狗,十分钟“学会”自我行走】
这只机器狗像一只着急的甲虫一样,在空中摆动着双腿。经过 10 分钟的挣扎,它成功地翻了过来。半小时后,这只机器狗像刚出生的牛犊一样笨拙地迈出了第一步。但一小时后,它就自信满满地在实验室里昂首阔步。
这个四条腿的#机器人# 的特别之处在于,它自发地学会了这一切,而不需要计算机仿真程序告诉它该怎么做。
加州大学伯克利分校的丹尼亚尔·哈夫纳(Danijar Hafner)和他的同事们使用了一种叫做强化学习的人工智能技术,这种技术通过奖励各种算法的有利行为来进行学习,以训练机器人在现实世界中从一无所知到能够行走。该团队使用了同样的算法,成功地训练了其他三个机器人,比如其中一个机器人能够捡起球并将这个球从一个托盘移动到另一个。
就传统方法而言,机器人在现实世界中尝试做任何事情之前都要在计算机模拟仿真中进行训练。例如,一对名为 Cassie 的机器腿,在计算机模拟中通过强化学习进行训练之后,才在现实中学会了走路。
问题是,你的计算机模拟程序永远不会准确得跟现实世界一样。你总是会错估这个世界的某些方面,”哈夫纳说,他与同事亚历山卓·埃斯康特雷拉(Alejandro Escontrela)和菲利普·吴(Philipp Wu)一起参与了这个项目,现在成了 DeepMind 公司的实习生。
他说,将模拟器中的经验教训应用到现实世界中也需要额外的工程实践。该团队的算法被称为“梦想者”,它利用过去的经验建立了一个周围环境的模型。
“梦想者”还允许机器人通过预测其潜在行为的未来可能结果,在计算机程序而非现实环境下反复进行试错法计算。
戳链接查看详情:http://t.cn/A6aRKhvq
