在智己 IM Ultra Agent 的群访后,单独和 CTO 项娇聊了几句具身智能的话题。
最近行业里有个挺明显的趋势——不少做自动驾驶的人开始转去做具身智能(机器人),很多人觉得两条赛道的技术路线其实越来越像,比如世界模型、VLA 这些。
于是我问了两个问题:
一是为什么会出现这种现象?
二是今天车载 Agent 距离真正的具身智能还有多远?
项娇的观点其实挺直接,可以总结成三点:
第一,不要把汽车排除在具身智能之外。
在他看来,汽车本身就是一个非常合适的具身智能载体。因为具身智能强调的是感知 + 执行 + 学习训练的一体化系统,而汽车天然具备这些条件:有传感器感知环境,有底盘执行动作,还有很大的端侧算力部署。甚至在 ToC 产品里,汽车可能是端侧算力规模最大的终端之一。
第二,智驾的人转去做机器人,其实不矛盾。
因为机器人也是具身智能的一种形态,本质上都是在做同一件事——让 AI 去控制物理世界。
第三,也是最关键的一点:
我们今天其实还没有真正进入具身智能阶段。
现在的技术链条依然是:
云端训练 → 模型蒸馏 → 端侧部署。
也就是说,感知、决策、执行、学习还没有形成真正的一体化闭环飞轮,这里面既有端侧算力的限制,也有模型架构的问题。
他的判断是:距离具身智能其实只差“一步”,可能是一小步,也可能是一大步,即:架构级变化。
说点我的感受。
近两年,大家讨论最多的是:
自动驾驶什么时候来?世界模型和VLA谁更好?
有趣的是,AI行业也在频繁讨论世界模型、VLA、Agent等等。
所以很多做智驾的人跑去做机器人,这并不奇怪,更不能说明“汽车行业缺乏想象空间”。
如果具身智能真的开始规模落地,汽车很可能会是最早跑通的消费级具身智能终端之一。
从这个角度看,智己今天所作出的尝试将非常有意义。
#千问大模型首发搭载智己LS8# #ai#
发布于 上海
