CarEngineer何先生 25-11-28 17:16
微博认证:2023微博新锐新知博主 汽车博主

VLA和世界模型,哪个是自动驾驶的未来?
✔VLA一派主要有理想,之前小鹏也是VLA路线支持者,但是第二代VLA,小鹏其实转向世界模型了。

✔世界模型一派,有华为,蔚来。蔚来NWM也上车很久了。

✔地平线走的是VA路线,把中间的L转译过程省掉了。

✔长城的答案是VLA+世界模型,典型的我都要。

VLA,擅长通过语言规则理解复杂世界,将【视觉感知—语言理解—行动执行】直接关联,把看—懂—做的联系起来。

VLA依赖语言作为中介,将摄像头雷达看到的东西,转化成语言token(比如红灯,有行人),然后基于语言模型推理规则(比如遇到红灯就要停车,遇到行人横穿马路就刹车),然后输出动作。

而世界模型,其实很好理解,就是真实世界的物理还原。

汽车工程运用中,其实(世界模型)更多,比如动力学控制,都是物理学模型。
只不过世界模型,很高级,在云端训练真实世界。

@吴会肖 长城的VLA+世界模型上车后,请求一个试驾。

发布于 江苏