新浪科技
26-05-26 11:41 微博认证:新浪科技官方微博

#小米智能手机平均售价创新高##小米商城推出全新会员体系#【#小米汽车发布世界模型全新框架#:重建 + 生成一体化,主流基准测试全面 SOTA】@小米技术 官方宣布,小米汽车今日发布 Xiaomi Auto World Model 全新框架,为业界辅助驾驶世界模型提供了新的框架路径,推动行业从“场景感知”向“认知推演、场景进化”的高阶形态跃迁。

据介绍,这是小米首次将三维重建与视频生成深度耦合的一体化架构,以「重建锚定几何、生成填补想象」的新范式,打破行业长期采用的重建、生成独立拆分路线。在 Waymo、nuScenes 等主流基准测试中全面取得 SOTA,并已在小米汽车合成数据、仿真测试、智能座舱三大核心场景完成业务落地。

目前,世界模型有两条主要技术路线 —— 重建(WorldRec)与生成(WorldGen),各有明确的优势与短板。

Xiaomi Auto World Model 则是提出一个全新的整合框架,将重建模块与生成模块深度耦合,让两者在结构上互相约束。重建提供 3D 几何作为结构化锚点,约束生成过程的稳定性;生成则把预测能力延伸到观测之外,弥补重建的边界。两者形成闭环、互相增益,从三个关键维度实现了“1+1>2”的协同增益:

高稳定性:WorldRec 的确定性几何约束,有效抑制长时序自回归中的误差累积与内容漂移。

高一致性:4D 场景表征作为跨帧共享记忆,确保不同时刻、不同视角下场景内容全局一致。

高真实性:WorldGen 以 WorldRec 渲染的 RGB 图像为几何骨架,使合成内容既符合物理布局,又贴近真实传感器观测,显著缩小了“仿真-现实”的领域鸿沟。