Mt慢谈 26-01-28 12:09

#蔚来世界模型全新版本发布#

这次的重点并不是领航换电,
而是训练范式的变化。

一、反直觉的「跛脚」天才

这半年如果我们去看大家对蔚来 NWM 的评价,我们会发现一个很反直觉的「能力倒挂」现象:

在人车混杂、毫无规则的城中村窄路,它像个老司机一样极限钻缝,游刃有余;偏偏在标线清晰、视野开阔的主干道大路口,它有时却变得不太自信,犹豫不决。

小路重拳出击,大路唯唯诺诺。

这听起来太反直觉了。按常理小路才是地狱难度,从 L2 到 L4,应该是先征服大路,再攻克小路,蔚来这是怎么反着来的?

因为只有把那些让车开得舒服的拐杖全部扔掉,才能学会真正的走路。

小路开得好,说明模型的物理直觉已经形成了,大路开不好,说明模型缺乏的是价值判断,新的 NWM 2.0 就是这个扔掉拐杖的孩子,终于在大马路上也学会走路了。

二、为什么大路反而更难?

这个反差其实很好解释。

小路是物理问题。

能不能过,看的是几何空间。CNN/Transformer 这种擅长提取空间特征的架构,只要感知到位,模型自然知道能不能走,该怎么走。

大路是社会博弈问题。

在宽阔路口,变道还是不变?这是一个概率问题,关乎人性与博弈。这不是几何能决定的,而是概率和策略。

端到端虽然能抛弃很多手写规则,但它依然要从人类数据里学。

在上一代模仿学习端到端的框架下,模型的工作是模仿人类。但问题是,人类的数据是脏的,数据里有人提前 2 公里就变道,有人压线 300 米才想起来,有人死守快车道到最后一刻,还有人干脆走错了。

面对这种多模态数据时,模型会倾向于输出一个平均值。

这就是为什么之前的 NWM 在宽阔大路上表现一般,它并不是不认路,而是它学会了既想变又不敢变的那个中间状态,在两条车道之间犹豫,既不果断也不安全。

三、想要解决这件事情,行业内也有很多成熟的做法。

面对大路的犹豫,行业里其实有一条极高性价比的捷径。有了端到端,并不需要 HD 高精地图,但可以用比 SD 地图更好的地图。

它比普通导航地图多了太多信息,包括车道数量,车道之间如何连接(哪条是直行道、哪条是左转道),弯道的曲率等等。

SD Map 虽然不是高精地图,但它像是一本参考书。它会开天眼告诉模型:前方 2km 有匝道,你应该现在就变道。这就好比考试时允许翻书,配合规则兜底,能以极低的成本解决 95% 的问题。

所以「大路更好,小路差一些」之所以更常见于各种辅助驾驶系统,本质上也是友商都多多少少在利用更丰富的地图信息,还加上一些规则兜底。

但蔚来拒绝了这条捷径。

任少卿是谁?作为 ResNet 和 Faster R-CNN 的核心作者,他做得很多事情都可以被总结为干掉人工特征,干掉人工规则。

做 ResNet,是为了干掉人工设计的网络层级。

做 Faster R-CNN,是为了干掉人工设计的检测框。​

所以 NWM 之前的大路犹豫,恰恰证明了蔚来没有作弊,任少卿心中的 NWM,也一定要干掉自动驾驶领域里最后那点人工地图和人工规则。

四、不加地图和规则,怎么提升体验?

最新的 NWM 版本,提升最大的就是大路上的体验,但这种提升并非来自规则的修补,而是模型真的开窍了。

新版 NWM 的核心变化,是训练方法从模仿人类转向自主优化,它和之前的区别用人话说就是:

模仿学习:大路怎么开?我看数据里有人 100 米变道,有人 300 米变道,我该学谁?结果模型取了平均值,在 200 米处犹豫。

强化学习:我在世界模型里把所有可能的变道时机都试了一遍,这种情况下 100 米变道成功率只有 60%,300 米变道成功率 95%。我自己算出来应该早点变。

模型不再盲目模仿人类混乱的行为,而是通过价值判断和仿真推演自己悟出了什么是最优策略,并不需要地图去告诉它该变道了。

如果你熟悉大语言模型(LLM)的发展史,会发现这一幕似曾相识。

从 GPT 3 的模仿学习续写文本,到 ChatGPT 引入 RLHF 来对齐人类意图,再到 o1 模型的 Chain of Thought, 蔚来 NWM 正在把 LLM 的进化路径,在物理世界的驾驶任务中重走了一遍。

五、当然,这条路也不是没有代价。

RL 的 Reward Function 依然需要大量人类先验知识,Sim2Real Gap 也始终存在,极端 Corner Case 也并不能通过这样的改变来完全解决。

更现实的问题在于,如果友商用 SD Map 在 95% 的场景下体验已经很好,那蔚来这套理论上限更高的架构,能否在短期内体现出明显优势?

如果算力、数据、算法的进步速度够快,NWM 这条路的上限确实更高,但如果进步速度不如预期,友商可能用更稳健的混合方案先占领市场。

就像增程确实在很长一段时间比纯电更容易被人接受一样。

技术理想主义和商业现实主义用于需要平衡,但至少在这一刻,蔚来证明了不装拐杖,也能学会走路。

#蔚来##蔚来智驾#

发布于 北京