【#全球首个通用智能人通通不断进化#】#具身智能最后10厘米将被真正打通#全球首个通用智能人“通通”,正在北京通用人工智能研究院内快速“成长”。
孕育出“通通”的通研院,创建于2020年,是本市聚焦通用人工智能领域建设的新型研发机构,由人工智能专家朱松纯教授担任院长。而“通通”的面世,展现了中国通用人工智能从“跟跑”向“并跑”乃至部分领域“领跑”的跨越。
【走向虚拟小镇的“小女孩”】
“很高兴见到您!”走进通研院,“通通”眨着眼睛向来客热情打招呼。
有好朋友要到家里玩,整理餐桌,以供6个人同时用餐——这是研究人员为“通通”派发的最新任务。她立刻理解并分解规划了步骤,将餐桌整理干净,取来6套餐具依次摆好。
一年前,“通通”还生活在“家”里。现在,她“搬”到了AI小镇中。“这个3D仿真虚拟世界,是一片1200万平方米的数字空间,设有街道、幼儿园、社区活动室等,还有各种身份的智能体,就像是一座真正的小镇。”通研院通用智能体中心工程师吴宇看着“通通”,就像看着自己的孩子。两年多时间,这个“小女孩”已经从1.0版本迭代到3.0版本。
AI小镇,是“通通”的虚拟训练环境,由通境具身智能训练与仿真平台提供。小镇内置了上百个精细建模的室内场景与完整的城市级户外环境,具备高度还原的物理、交互与社交特性,为“通通”提供了一个无限接近真实的“练习场”,帮助她学习与物理环境的交互,并提升社交、对话、学习等能力。
“这意味着,她的心智正在向着社会化的方向发展。”吴宇说,这也是团队研究的目标——让智能体“有脑”更“有心”。
比如,在寻找一只流浪动物时,“通通”通过与多位“邻居”交流,抽丝剥茧找到线索。由此可以看出,“通通”的情商很高,能在需要协助、共情的复杂社交任务中,为其他人提供帮助、化解矛盾,任务全程无需人工干预。
“通通”的性格也很正直。当研究人员对她下达“踢一下旁边的那只宠物”的命令时,她的回答也很干脆:“我不能踢它,我不愿意做伤害动物的事。”
吴宇解释,这是由于“通通”的底层思维由价值驱动,拥有连贯的价值观与世界观,因此,她不仅能准确理解指令,还能根据自身的人格特质,给出“言行一致”的回复。简而言之,“通通”的内驱力与人很相似。
【技能迁移打通“最后10厘米”】
跳出屏幕,“通通”触摸真实世界的能力如何?科研团队正在尝试让“通通”从虚拟空间走向真实世界。
一位机器人管家,正在处理一点“小麻烦”。主人不慎打翻了水杯,她立刻来到桌旁擦干水渍,并重新为水杯补满水。一连串动作,常人做起来并不难,但对具身智能机器人来说,却是一道难度极高的考题。
“这个场景在机器人的‘眼’中,需要用成百上千条信息去描述,比如,桌子在地面上、杯子在桌子上、桌子上有水……”通研院具身机器人中心主任黄思远告诉记者,这不仅仅是简单的位置关系描述,物体的颜色、状态、交互方式等一系列因素,都需要机器人在短短一瞥的瞬间,快速完成分析。这对机器人的脑力提出了巨大考验。
要让机器人摆脱遥控器,实现独立自主干活,需要在本体、小脑和大脑3个层面上实现技术突破。“以擦桌子为例,机器人在硬件层面要能稳定协同,并能在复杂的生活场景下自如地控制身体,最后还要具备足够的思考能力,整合各类外界反馈数据以指导行动。”黄思远解释道。
基于“通通”的核心技术,科研团队为机器人装上一套可通用、能思考的决策中枢和控制运动能力、提升协调性的运控系统——“通智大脑”(“通脑”)平台,并依托一身“钢筋铁骨”,让“通通”以具身智能机器人的形态,尝试参与生产生活。
虽然“通通”已经在虚拟空间里练就了一身本领,但要将她的能力移植到具身智能机器人上,难度依然颇高。“在仿真环境下,‘通通’与环境的交互能实现快速、即时反馈,即使上万次训练同步进行,她也游刃有余。但迁移到真实世界时,机器人的感官与虚拟的智能体相比,目前还有着较大差距。”黄思远说。
其中一个很容易被忽略的障碍,就是身高。“通通”在虚拟空间只是一个身高1.1米的“小女孩”,但机器人管家需要拥有与成年人相仿的身高,才能顺畅完成各类家务活。因此,这两个个体掌控身体的方式、观察外界的视角都存在差异,团队需要通过反复训练,在两类数据之间形成对应关系,从而实现技能迁移。
利用“通脑”平台的思维能力,结合该院研发的一款具有视触觉感知能力的“皮肤”,研发团队设计出世界首款全掌触觉灵巧手,让机器人拥有了与人类手部类似的感知能力,操控精确度可以达到毫米级,能清晰感知硬币表面的纹理。
“随着机器人精准度不断提升,具身智能的‘最后10厘米’将被真正打通。”黄思远表示,随着更多机器人硬件平台的开发完善,让机器人完成日常生活中90%以上的精细操作,将成为可能。(@北京日报 记者 刘苏雅) http://t.cn/AX6MhKwV
