理想智能驾驶技术研发负责人贾鹏和智驾副总裁郎咸朋谈特斯拉 FSD:
贾鹏:FSD 其实是轻图,特斯拉在美国能拿到道路拓扑信息,而这在国内是拿不到的。
而我们是真的无图,没有任何地图先验信息。
郎咸朋:要走到 L4,必须让系统学会处理未知场景。这个能力,我们认为必须用 VLM 来解决,而不是端到端。
它能学到一些常识以应对未知情况,比如识别没见过的非常规红绿灯,各种形式的潮汐车道标识,学校周边特征等等,提前告诉车不能进入或要减速。
贾鹏:从公开信息看,特斯拉目前的技术架构没有 VLM。
谈目前各家端到端的区别:
贾鹏:小鹏 5.2 的架构和理想 7 月刚全量推的无图类似,感知是一个模型,决策是一个模型,中间再串起来。华为已经发布的 ADS 3.0 也是分段的端到端。
特斯拉则是从感知到决策都是一个模型。理想的最新版本也实现了将感知到决策融合成一个模型。
郎咸朋:one model 才真正可以做 L3、L4 级自动驾驶。
理想也在做云端的世界模型,用来做两件事:一是 VLM 可以用云端的世界模型蒸馏出来,就是先在云端训练一个超大模型,比如 Meta 最近发布的 400 B 参数的 Lamma 3.1,再去蒸馏一个 8 B 的模型,这比从头训练 8 B 模型效果更好。
二是世界模型可以考察系统 1、系统 2 的能力。理想在做端到端无图的过程中发现全国验证非常难,有 1000 万公里的路,之前只能铺人力去测。
发布于 上海
