香港大学李弘扬团队联合华为、上海创智学院及清华大学李升波教授团队，发表的最新论文World Engine: Towards the Era of Post-Training for Autonomous Driving，一个核心：以前的自动驾驶，像是在驾校里“背书”考驾照；而 World Engine 带来的“后训练”，像是拿到驾照后“真上路”，在各种复杂路况

香港大学李弘扬团队联合华为、上海创智学院及清华大学李升波教授团队，发表的最新论文World Engine: Towards the Era of Post-Training for Autonomous Driving，一个核心：
以前的自动驾驶，像是在驾校里“背书”考驾照；而 World Engine 带来的“后训练”，像是拿到驾照后“真上路”，在各种复杂路况中“练车”，从而真正学会开车。

论文认为，现在的自动驾驶系统就像一个已经“背完”了驾驶理论书和海量驾驶录像的学员。他知道直行、跟车、转弯等所有“标准答案”，在路上遇到常规情况时能处理得不错。

但是，一旦遇到极少发生但后果严重的长尾事件——比如突然窜出的外卖电动车、被大车遮挡的“鬼探头”、路面遗落的障碍物——他就容易“懵”。为什么？因为这类危险场景在真实数据里太少了。只靠“背书”解决不了所有问题。

World Engine 的核心，就是为自动驾驶系统建立了一个高保真的“虚拟练车场”。它通过三个步骤，让系统在虚拟世界里“吃一堑，长一智”。

第一步：把事故变成“3D电影” (SimEngine)
首先，World Engine 会分析真实路测中遇到的每一个失败案例。它不是简单回放视频，而是利用“3D高斯泼溅”技术，把这个场景重建成一个细腻、可交互的3D虚拟世界。系统可以在这个世界里自由行动，观察不同角度的细节。

第二步：生成“十万个怎么办” (难例挖掘与生成)
光有事故回放还不够，系统还需要“举一反三”。World Engine 会让预训练模型自己去海量数据里“找茬”，挖掘出所有它处理得不够好的潜在危险场景。然后，它会像写剧本一样，把这些场景的无数种变体都生成出来：如果电动车再快一点怎么办？如果雨天路滑怎么办？通过这种方式，将稀缺的“长尾”场景变得密集且多样。

第三步：在“虚拟考场”强化训练 (强化学习后训练)
最后，系统被放入这个充满各种“考题”的虚拟世界里进行强化学习。每做出一个决策，虚拟世界都会给出即时反馈。在这里犯错没有物理风险，系统可以在无数次试错中学会如何在危险场景下做出最安全的选择，从“开得快”进化为“开得对”。

这套方法的效果已经在实际系统中得到了验证。在一个行业级的闭环仿真平台上，经过World Engine后训练的自动驾驶系统取得了显著成果：
碰撞率暴降：在模拟测试中，碰撞率降低了45.5%。
长距离0接管：在长达200公里的测试中，实现了0次人工接管。
超越数据堆砌：其带来的性能提升，远大于单纯增加预训练数据量

这篇论文的突破在于，它借鉴了DeepSeek在AI领域引爆的“后训练”范式革命，并将其成功应用到了物理世界的自动驾驶中。它证明了让自动驾驶真正变安全的关键，或许不再是“读更多的书”（堆砌数据），而是“有方法地多练车”（在高质量仿真环境中进行后训练）。其核心的World Engine技术已被华为集成到ADS 4.0的WEWA架构中。#华为乾崑智驾##自动驾驶##微博新知#

发布于北京