第一电动网
26-06-22 15:10 微博认证:第一电动网(www.d1ev.com)官方微博

香港大学李弘扬团队联合华为、上海创智学院及清华大学李升波教授团队,发表的最新论文World Engine: Towards the Era of Post-Training for Autonomous Driving,一个核心:
以前的自动驾驶,像是在驾校里“背书”考驾照;而 World Engine 带来的“后训练”,像是拿到驾照后“真上路”,在各种复杂路况中“练车”,从而真正学会开车。

论文认为,现在的自动驾驶系统就像一个已经“背完”了驾驶理论书和海量驾驶录像的学员。他知道直行、跟车、转弯等所有“标准答案”,在路上遇到常规情况时能处理得不错。

但是,一旦遇到极少发生但后果严重的长尾事件——比如突然窜出的外卖电动车、被大车遮挡的“鬼探头”、路面遗落的障碍物——他就容易“懵”。为什么?因为这类危险场景在真实数据里太少了。只靠“背书”解决不了所有问题。

World Engine 的核心,就是为自动驾驶系统建立了一个高保真的“虚拟练车场”。它通过三个步骤,让系统在虚拟世界里“吃一堑,长一智”。

第一步:把事故变成“3D电影” (SimEngine)
首先,World Engine 会分析真实路测中遇到的每一个失败案例。它不是简单回放视频,而是利用“3D高斯泼溅”技术,把这个场景重建成一个细腻、可交互的3D虚拟世界。系统可以在这个世界里自由行动,观察不同角度的细节。

第二步:生成“十万个怎么办” (难例挖掘与生成)
光有事故回放还不够,系统还需要“举一反三”。World Engine 会让预训练模型自己去海量数据里“找茬”,挖掘出所有它处理得不够好的潜在危险场景。然后,它会像写剧本一样,把这些场景的无数种变体都生成出来:如果电动车再快一点怎么办?如果雨天路滑怎么办?通过这种方式,将稀缺的“长尾”场景变得密集且多样。

第三步:在“虚拟考场”强化训练 (强化学习后训练)
最后,系统被放入这个充满各种“考题”的虚拟世界里进行强化学习。每做出一个决策,虚拟世界都会给出即时反馈。在这里犯错没有物理风险,系统可以在无数次试错中学会如何在危险场景下做出最安全的选择,从“开得快”进化为“开得对”。

这套方法的效果已经在实际系统中得到了验证。在一个行业级的闭环仿真平台上,经过World Engine后训练的自动驾驶系统取得了显著成果:
碰撞率暴降:在模拟测试中,碰撞率降低了45.5%。
长距离0接管:在长达200公里的测试中,实现了0次人工接管。
超越数据堆砌:其带来的性能提升,远大于单纯增加预训练数据量

这篇论文的突破在于,它借鉴了DeepSeek在AI领域引爆的“后训练”范式革命,并将其成功应用到了物理世界的自动驾驶中。它证明了让自动驾驶真正变安全的关键,或许不再是“读更多的书”(堆砌数据),而是“有方法地多练车”(在高质量仿真环境中进行后训练)。其核心的World Engine技术已被华为集成到ADS 4.0的WEWA架构中。#华为乾崑智驾##自动驾驶##微博新知#

发布于 北京