艹数码又胡言乱语了[流鼻血]“业内还有第3条路：死磕端到端？” --这话错到离谱了所谓端到端，只是指传感器数据输入到神经网络、由神经网络决策后输出驾驶参数的技术范式，如果不理解什么是范式，就当它是大致的工作流程来理解也行。无论是华为的WEWA世界模型、还是其它厂商的世界模型，或是理想小

艹数码又胡言乱语了[流鼻血]

“业内还有第3条路：死磕端到端？” --这话错到离谱了
所谓端到端，只是指传感器数据输入到神经网络、由神经网络决策后输出驾驶参数的技术范式，如果不理解什么是范式，就当它是大致的工作流程来理解也行。
无论是华为的WEWA世界模型、还是其它厂商的世界模型，或是理想小鹏等厂商采用的VLA，它们都是遵循端到端流程的！
艹数码把范式和模型混为一谈，无中生有造出所谓的第三条技术路径[二哈]

还有什么华为的WEWA世界模型只是把VLA中的L去掉后成VA，也完全是误导人。
WEWA是WE+WA，WE是指云端世界引擎，WA是指车端世界行为模型，WE负责在云端泛化生成各种高精度3D虚拟驾驶场景后进行深度强化学习，因为是高精度3D场景，所以华为的世界模型天生对3D空间友好。而VLA是视觉-语言-动作模型，是输入原始二维图像构成的视屏来进行训练的。世界模型需要生成虚拟世界的动态场景，对云端算力的需求根本不是VLA能比的，对数据质量的要求之高也不是VLA能比的，这两种压根就不是一个技术路线的模型........有点太虾扯蛋了[doge]

而且这两种模型也并不是完全对立的，而是可以兼容的，混合专家模型不就是这么回事么？华为蔚来MMT地平线特斯拉都是采用自研的世界模型，有的现在就包含VLA上层、有的不包含，华为的ADS4.0就用VLA上层做了语义理解和决策协助！反过来说，理想小鹏哪天想搞世界模型来辅助也是可以的，前提是得有做好世界模型的能力。

当然，有一些说得还是对的，用VLA的原因大概一是数据合成做不好、导致数据质量太低，二是确实搞不了多模态原生模型、所以直接借力行业。打听了下，小鹏理想小米的语义基座应该用的都是阿里的qwen或是魔改了qwen。

其实艹数码早就把我拉黑了，我平时也不会无聊到去看他的微博，今天是有个朋友看了他的微博跟我讨论了下，我觉得这样乱误导人不好，所以发个微博纠正下。

发布于浙江