智己CTO解析具身智能

在智己 IM Ultra Agent 的群访后，单独和 CTO 项娇聊了几句具身智能的话题。

最近行业里有个挺明显的趋势——不少做自动驾驶的人开始转去做具身智能（机器人），很多人觉得两条赛道的技术路线其实越来越像，比如世界模型、VLA 这些。

于是我问了两个问题：
一是为什么会出现这种现象？
二是今天车载 Agent 距离真正的具身智能还有多远？

项娇的观点其实挺直接，可以总结成三点：

第一，不要把汽车排除在具身智能之外。

在他看来，汽车本身就是一个非常合适的具身智能载体。因为具身智能强调的是感知 + 执行 + 学习训练的一体化系统，而汽车天然具备这些条件：有传感器感知环境，有底盘执行动作，还有很大的端侧算力部署。甚至在 ToC 产品里，汽车可能是端侧算力规模最大的终端之一。

第二，智驾的人转去做机器人，其实不矛盾。
因为机器人也是具身智能的一种形态，本质上都是在做同一件事——让 AI 去控制物理世界。

第三，也是最关键的一点：
我们今天其实还没有真正进入具身智能阶段。

现在的技术链条依然是：
云端训练 → 模型蒸馏 → 端侧部署。

也就是说，感知、决策、执行、学习还没有形成真正的一体化闭环飞轮，这里面既有端侧算力的限制，也有模型架构的问题。

他的判断是：距离具身智能其实只差“一步”，可能是一小步，也可能是一大步，即：架构级变化。

说点我的感受。

近两年，大家讨论最多的是：
自动驾驶什么时候来？世界模型和VLA谁更好？

有趣的是，AI行业也在频繁讨论世界模型、VLA、Agent等等。

所以很多做智驾的人跑去做机器人，这并不奇怪，更不能说明“汽车行业缺乏想象空间”。

如果具身智能真的开始规模落地，汽车很可能会是最早跑通的消费级具身智能终端之一。

从这个角度看，智己今天所作出的尝试将非常有意义。

#千问大模型首发搭载智己LS8# #ai#

发布于上海