兔撕鸡大老爷
26-06-17 19:09 微博认证:2024微博年度新知博主 科技博主

#机器人行业还没到GPT1水平#
一直很爱看@卫诗婕SJ_Jelyne 的#科技漫谈#

智元机器人合伙人、觅蜂科技董事长@姚卯青 认为:现在很多具身智能只能做“视觉到动作”的肌肉映射,还远未达到自主理解世界的“智能”;限制它走向觉醒的是触觉、力觉、温度、场景等等复杂的数据维度和数据量的欠缺。具身智能距离涌现还处于前夜的前夜,真正觉醒至少还需要一亿小时真实数据。

这又对应着巨量的存储需求。

现在有三大核心技术路线流派。

以智元、Figure AI为代表的VLA(视觉语言动作)模型路线,追求“通用智能”,试图让机器人像人类一样通过视觉感知、语言理解,最终直接控制动作执行。计算开销大,对硬件续航和散热要求高;

以特斯拉为代表的世界模型路线,在AI系统内部构建物理世界的模拟器,为机器人注入对物理规律的直觉理解,重度依赖高质量的仿真数据。

以波士顿、智元为代表的分层决策与软硬件协同路线。走务实路径,将复杂任务拆解。由大模型负责任务语义理解与子任务分解,传统算法负责定位、导航、精密控制等基础功能。

但目前,三大路线都还没有到达GPT1水平。

然后又分全栈自研、供应链整合、运动专精控制派、数据采集流派等等。

也有的直接采购宇树、智元机器人,自己团队来二次开发,刷入大模型和算法。

处于百舸争流的状态。

注:智元、宇树都已不是单一维度的技术流派,迈向了全栈开放生态的综合流派。

发布于 江西