#AI玩我的世界登Nature##AI在我的世界自行探索#
正值《#我的世界大电影#》热映之际,谷歌DeepMind这边整了个活:他们把AI系统扔进《我的世界》游戏中,不靠人类教学,让AI自己摸索学习,结果还登上了Nature。
这就是谷歌DeepMind的“通用智能”探索项目,其AI系统名为Dreamer,它纯纯从0开始,在没人教的情况下,自己学会了挖钻石。
要知道,在《Minecraft》里挖到钻石并不简单,需要先砍树做木板、制作工作台、合成工具、开采石头、建熔炉、找到铁矿、冶炼出铁锭,再打造铁镐,最后深入地下寻找钻石……整个过程包含了12个步骤,环环相扣。
之前的AI也试过在Minecraft挑战找钻石,但大多需要人类打样、喂视频。而Dreamer自己就学会了。
为了引导AI学习,研究团队设计了一个奖励机制:每完成其中一个步骤,Dreamer就会获得一次奖励。这样一来,它便能通过不断尝试,逐步优化策略,最终完成整套流程。
关键在于,Dreamer的学习并不仅限于“试错”,它背后依赖一个“世界模型”(World Model)。
换句话说,AI可以在大脑中可以“模拟”未来情境,预想“如果我砍树,会得到木头;有了木头就能做工具;有了工具就能挖石头,进一步做出铁镐……”也就是在行动前形成清晰的因果推演链。
就连研究者Danijar Hafner都说:“我们原本没指望它能完成这种复杂任务,结果它真干成了,是迈向通用人工智能(AGI)的关键一步。”
Dreamer的能力并不仅局限于游戏世界。
未来,像它这样的AI,或许能自行学习如何下厨、开车、组装家具、搭帐篷露营等复杂任务。无论环境多么陌生、多么复杂,它们都可能具备像人类一样的自主学习与适应能力。
感兴趣的小伙伴可以点击:http://t.cn/A6rSNKw0
