VLA与世界模型技术路线探讨

VLA和世界模型，哪个是自动驾驶的未来？
✔VLA一派主要有理想，之前小鹏也是VLA路线支持者，但是第二代VLA，小鹏其实转向世界模型了。

✔世界模型一派，有华为，蔚来。蔚来NWM也上车很久了。

✔地平线走的是VA路线，把中间的L转译过程省掉了。

✔长城的答案是VLA+世界模型，典型的我都要。

VLA，擅长通过语言规则理解复杂世界，将【视觉感知—语言理解—行动执行】直接关联，把看—懂—做的联系起来。

VLA依赖语言作为中介，将摄像头雷达看到的东西，转化成语言token(比如红灯，有行人)，然后基于语言模型推理规则(比如遇到红灯就要停车，遇到行人横穿马路就刹车)，然后输出动作。

而世界模型，其实很好理解，就是真实世界的物理还原。

汽车工程运用中，其实(世界模型)更多，比如动力学控制，都是物理学模型。
只不过世界模型，很高级，在云端训练真实世界。

@吴会肖长城的VLA+世界模型上车后，请求一个试驾。

发布于江苏