猩红线歌者 26-04-30 16:20
微博认证:微博新知博主 汽车博主

小鹏X-Cache实质上是自动驾驶世界模型领域一项非常重磅的创新,但是很多媒体讲的东西过于技术细节了,双指标门控和自适应阈值虽然设计得十分精巧,但大部分人都看不懂,反而宣传上把最骚的几个地方漏了[卡皮巴拉]。

先说我认为最重要的: X-Cache是一项免训练、即插即用的技术。它不需要调整世界模型架构,也不需要重新训练世界模型,甚至不依赖特定的硬件指令集,可以直接嵌入推理的pipeline中,这意味着不仅小鹏可以用,行业内只要做世界模型的厂商都可以用。

另外,很多人也没注意到论文中X-Cache的验证芯片竟然是国产厂商平头哥的真武810E,这种即插即用+国产芯片的组合不仅给世界模型加了速,也给中国世界模型行业加了速。

价值上完了,可能有人会问是不是小鹏的AI infra团队做了一项谁都可以做的工作或者只是站在巨人的肩膀上整合“微微创新”了一下?答案是否定的。

我之前和诸如极佳科技等业内主流做世界模型的厂商交流过,自动驾驶领域的世界模型普遍是少步的,但是仍然用主要还是跨步加速也就是Cross-Step Cache,例如FlowCache、Scope和DeepCache等等,这就导致实际加速收益不大,如果步数只有个位数,步间差距过大,甚至会直接失效。

而X-Cache首创了Cross-Chunk Cache,不再用步间相似特性,而是采用相近视频块的物理连续性并且借鉴CNN的经验复用残差,既轻量又稳定,直接将世界模型的推理速度提升了二点几倍,让已经训练完成的世界模型跑的更快,更节省算力,更便于部署,十分适合缺芯的国内环境。

当然,懂哥都知道,复用残差并不是完美无缺的,也一样会累积误差,X-Cache专门设计了一套安全机制,采用定期强制全量计算刷新KV Cache,切断误差传播并且强制计算噪声最大的第一步,强制计算每个序列的前几block作为基准等等方式为稳定运行兜底。

不过有点遗憾的是,X-Cache目前只测试过22秒的世界片段,没有在更长的序列上验证过,也没有在夜间暴雨等极端场景下验证过,这一块仍需后面再进行一定的工作,增强其可用性和普适性。

发布于 湖北