理想智能驾驶技术研发负责人贾鹏和智驾副总裁郎咸朋谈特斯拉 FSD：贾鹏：FSD 其实是轻图，特斯拉在美国能拿到道路拓扑信息，而这在国内是拿不到的。而我们是真的无图，没有任何地图先验信息。郎咸朋：要走到 L4，必须让系统学会处理未知场景。这个能力，我们认为必须用 VLM 来解决，而不是端到端

理想智能驾驶技术研发负责人贾鹏和智驾副总裁郎咸朋谈特斯拉 FSD：

贾鹏：FSD 其实是轻图，特斯拉在美国能拿到道路拓扑信息，而这在国内是拿不到的。

而我们是真的无图，没有任何地图先验信息。

郎咸朋：要走到 L4，必须让系统学会处理未知场景。这个能力，我们认为必须用 VLM 来解决，而不是端到端。

它能学到一些常识以应对未知情况，比如识别没见过的非常规红绿灯，各种形式的潮汐车道标识，学校周边特征等等，提前告诉车不能进入或要减速。

贾鹏：从公开信息看，特斯拉目前的技术架构没有 VLM。

谈目前各家端到端的区别：

贾鹏：小鹏 5.2 的架构和理想 7 月刚全量推的无图类似，感知是一个模型，决策是一个模型，中间再串起来。华为已经发布的 ADS 3.0 也是分段的端到端。

特斯拉则是从感知到决策都是一个模型。理想的最新版本也实现了将感知到决策融合成一个模型。

郎咸朋：one model 才真正可以做 L3、L4 级自动驾驶。

理想也在做云端的世界模型，用来做两件事：一是 VLM 可以用云端的世界模型蒸馏出来，就是先在云端训练一个超大模型，比如 Meta 最近发布的 400 B 参数的 Lamma 3.1，再去蒸馏一个 8 B 的模型，这比从头训练 8 B 模型效果更好。

二是世界模型可以考察系统 1、系统 2 的能力。理想在做端到端无图的过程中发现全国验证非常难，有 1000 万公里的路，之前只能铺人力去测。

发布于上海