又菜又爱玩的老司机
25-08-31 03:08 微博认证:汽车博主

艹数码又胡言乱语了[流鼻血]

“业内还有第3条路:死磕端到端?” --这话错到离谱了
所谓端到端,只是指传感器数据输入到神经网络、由神经网络决策后输出驾驶参数的技术范式,如果不理解什么是范式,就当它是大致的工作流程来理解也行。
无论是华为的WEWA世界模型、还是其它厂商的世界模型,或是理想小鹏等厂商采用的VLA,它们都是遵循端到端流程的!
艹数码把范式和模型混为一谈,无中生有造出所谓的第三条技术路径[二哈]

还有什么华为的WEWA世界模型只是把VLA中的L去掉后成VA,也完全是误导人。
WEWA是WE+WA,WE是指云端世界引擎,WA是指车端世界行为模型,WE负责在云端泛化生成各种高精度3D虚拟驾驶场景后进行深度强化学习,因为是高精度3D场景,所以华为的世界模型天生对3D空间友好。而VLA是视觉-语言-动作模型,是输入原始二维图像构成的视屏来进行训练的。世界模型需要生成虚拟世界的动态场景,对云端算力的需求根本不是VLA能比的,对数据质量的要求之高也不是VLA能比的,这两种压根就不是一个技术路线的模型........有点太虾扯蛋了[doge]

而且这两种模型也并不是完全对立的,而是可以兼容的,混合专家模型不就是这么回事么?华为蔚来MMT地平线特斯拉都是采用自研的世界模型,有的现在就包含VLA上层、有的不包含,华为的ADS4.0就用VLA上层做了语义理解和决策协助!反过来说,理想小鹏哪天想搞世界模型来辅助也是可以的,前提是得有做好世界模型的能力。

当然,有一些说得还是对的,用VLA的原因大概一是数据合成做不好、导致数据质量太低,二是确实搞不了多模态原生模型、所以直接借力行业。打听了下,小鹏理想小米的语义基座应该用的都是阿里的qwen或是魔改了qwen。

其实艹数码早就把我拉黑了,我平时也不会无聊到去看他的微博,今天是有个朋友看了他的微博跟我讨论了下,我觉得这样乱误导人不好,所以发个微博纠正下。

发布于 浙江