今天小米汽车正式发布 Xiaomi Auto World Model 全新技术框架,以三维重建与视频生成深度融合的一体化创新,打破行业固有技术壁垒,在主流权威基准测试中实现全面SOTA,为智能驾驶开辟全新发展路径。
长期以来,行业内世界模型分为重建(WorldRec)与生成(WorldGen)两条技术路线,二者各有短板:重建能精准还原3D实景,却无法推演未知场景;生成可想象未来画面,却缺少物理结构约束,极易出现场景漂移。过往厂商仅做简单技术拼接,导致两种方案优势相互抵消。
小米用打造重建+生成深度耦合的一体化架构,形成双向赋能闭环。重建模块负责锁定精准几何结构,为生成提供物理约束,筑牢场景根基;生成模块负责拓展场景边界,补齐重建无法覆盖的未来区域与遮挡画面,弥补想象缺口,二者协同抑制长时序推演误差,实现高稳定、高一致、高真实三大核心优势。
在核心技术上,小米实现双重革新,WorldRec告别传统逐像素渲染,升级为稀疏锚点建模,用更低算力实现更精准的场景重建;WorldGen依托3D几何骨架,实现高速长时序生成,可复刻暴雨、异物闯入等各类长尾危险场景,为智驾训练提供海量稀缺数据。
这套模型不仅在Waymo、nuScenes等权威测试中登顶行业,更已落地合成数据生成、仿真测试、智能座舱三大业务场景,完成从实验室技术到产业应用的跨越。
当智能驾驶拥有了预判未来的能力,小米汽车世界模型,正在重新定义高阶智驾的安全,推动行业正式迈入认知推演的新阶段。
#小米##小米[超话]#
http://t.cn/AX6NP9B1
发布于 广东
