#具身智能数据采集##鹿明机器人##UMI#
“我们只交付100%可以复现的轨迹。”
具身智能创企鹿明机器人媒体沟通会上,联席CTO丁琰对具身智能数据采集现状、困境,以及最新兴的采集方式UMI作了前沿的深度分享。
他在分享中反复强调,很多团队以为具身模型训不出来是卡在训练阶段,实际多数问题在数据生成的起点就已经埋下了。后面再堆模型、堆算力,只是在给错误输入继续加速。
丁琰的履历能解释他为什么会把“数据的可训练性”看得这么重。
他的研究方向是机器人学与具身智能,2024年3月从美国纽约州立大学计算机学院博士毕业。去年年底加入鹿明之前,他做过一星机器人的CTO,更早则在上海AI Lab担任研究员。
按他的说法,从2024年3月起,他就持续投入UMI方向,是大陆最早做UMI方向的人。
UMI全称叫Universal Manipulation Interface,最早来自斯坦福在2024年2月提出的一套工作。
其核心是用与具体机器人本体解耦的方式,记录人类在真实物理世界中的操作行为,把“操作意图+运动轨迹+多模态感知”统一到一个通用接口里,供不同形态的机器人学习和复现。
在去年9月之前,UMI还是一个偏冷门的方向。
具身智能进入下半场后,数据的重要性与日俱增。
丁琰分享道,前段时间有人归纳了具身智能在解决数据难题时的四种解法。
- 遥操作数据,最著名的代表是智元机器人。
- 仿真数据,代表公司是银河通用机器人。
- 人类视频数据,它石智能就是这种解法的代表。
- UMI,去年9月开始冒头,鹿明就是代表性公司。
鹿明基于现实需求,做出了一个名为FastUMI Pro的产品,这是一个无本体数采硬件。
系统适配市面主流机械臂和夹爪,机身重量在600多克量级,但能夹起两三公斤物品,场景覆盖工厂与家庭。
它还支持多模态输入,包括触觉、听觉、六维力等。
在UMI设备最核心的空间精度上,丁琰称FastUMI Pro的1mm是“全球最高精度”。
硬件产品背后,还有鹿明布局的数据采集、模型训练生态。http://t.cn/AXblVubR
