小米汽车发布世界模型

#小米汽车发布世界模型全新框架# 自动驾驶的世界模型，过去一直有两条路。一条是重建派，擅长高保真复制场景，但缺乏想象力；另一条是生成派，能天马行空地预测未来，但时间一长就容易“漂移”，画面失真。

小米汽车今天发布的Xiaomi Auto World Model框架，大概率是想打破这种格局。其逻辑是：把重建和生成“焊”在一起——让3D几何充当物理锚点，约束生成稳定性；让生成去填补未见边界，弥补重建的局限。这种深度耦合架构，做到了1+1>2。

从效果看，这套框架确实拿得出手。在Waymo数据集重建测试中PSNR达28.48，超越了此前最佳方法；在nuScenes上生成效率比同类自回归方法快约5.6倍。更关键的是，它不只是跑分漂亮，其已经交付超10万clips合成数据，并落地仿真测试和智能座舱。这意味着这套技术已经开始实战了。

但还是有些问题。其一，SOTA只是公开基准测试的领先，不等于在实际复杂路况下的绝对可靠；其二，世界模型从看得准到想得对，中间还有物理规律理解这个巨大鸿沟。辅助驾驶级别上，这类框架目前仍是锦上添花，尚未成为安全决策的雪中送炭。

小米这步棋，方向对了。但真正的考验，在论文之外的实战。#大v聊车##热点观点# http://t.cn/AX6pIyN1

发布于北京