#小米汽车发布世界模型全新框架# 自动驾驶的世界模型,过去一直有两条路。一条是重建派,擅长高保真复制场景,但缺乏想象力;另一条是生成派,能天马行空地预测未来,但时间一长就容易“漂移”,画面失真。
小米汽车今天发布的Xiaomi Auto World Model框架,大概率是想打破这种格局。其逻辑是:把重建和生成“焊”在一起——让3D几何充当物理锚点,约束生成稳定性;让生成去填补未见边界,弥补重建的局限。这种深度耦合架构,做到了1+1>2。
从效果看,这套框架确实拿得出手。在Waymo数据集重建测试中PSNR达28.48,超越了此前最佳方法;在nuScenes上生成效率比同类自回归方法快约5.6倍。更关键的是,它不只是跑分漂亮,其已经交付超10万clips合成数据,并落地仿真测试和智能座舱。这意味着这套技术已经开始实战了。
但还是有些问题。其一,SOTA只是公开基准测试的领先,不等于在实际复杂路况下的绝对可靠;其二,世界模型从看得准到想得对,中间还有物理规律理解这个巨大鸿沟。辅助驾驶级别上,这类框架目前仍是锦上添花,尚未成为安全决策的雪中送炭。
小米这步棋,方向对了。但真正的考验,在论文之外的实战。#大v聊车##热点观点# http://t.cn/AX6pIyN1
发布于 北京
