VLA和世界模型,哪个是自动驾驶的未来?
✔VLA一派主要有理想,之前小鹏也是VLA路线支持者,但是第二代VLA,小鹏其实转向世界模型了。
✔世界模型一派,有华为,蔚来。蔚来NWM也上车很久了。
✔地平线走的是VA路线,把中间的L转译过程省掉了。
✔长城的答案是VLA+世界模型,典型的我都要。
VLA,擅长通过语言规则理解复杂世界,将【视觉感知—语言理解—行动执行】直接关联,把看—懂—做的联系起来。
VLA依赖语言作为中介,将摄像头雷达看到的东西,转化成语言token(比如红灯,有行人),然后基于语言模型推理规则(比如遇到红灯就要停车,遇到行人横穿马路就刹车),然后输出动作。
而世界模型,其实很好理解,就是真实世界的物理还原。
汽车工程运用中,其实(世界模型)更多,比如动力学控制,都是物理学模型。
只不过世界模型,很高级,在云端训练真实世界。
@吴会肖 长城的VLA+世界模型上车后,请求一个试驾。
发布于 江苏
