车的"脑内小剧场",小鹏先做到了🎬
你开车时会预判前车急刹、旁车加塞对吧?现在,小鹏的智驾系统也会了——而且能把"思考过程"展示给你看。
今天,小鹏正式发布了X-Mind技术框架。
X-Mind指的是什么?和现有的智驾系统又有什么区别呢?
目前很多智驾是"先看到再行动",而小鹏的X-Mind可以让车在行动前先进行"脑内推演":通过视觉思维链,提前预判障碍物占位和交通流变化,从本能反应进化为主动思考。
简单用一句话来说,就是智驾系统既可以理解当下发生了什么,也可以预判此后会发生什么,想清楚再动手。
最直观的感知场景就是:当面对匝道汇入、复杂路口博弈这些老司机都头疼的复杂情况时,搭载X-Mind的第二代VLA能提前规划出更防御性、更拟人的路径,从而做出更安全的行动。
一直以来,很多人都认为VLA和世界模型是两种不同的技术路线,要想真正理解X-Mind,必须先知道这两个词到底意味着什么。
VLA是让车跟着人学——从海量真实驾驶数据里学人类怎么判断、怎么操作;
世界模型是让车理解物理世界本身——预测环境怎么变化、行动会带来什么后果。
既然二者逻辑不同,那到底该如何选择?
刘先明在CVPR 2026上给出了小鹏的答案:"它们不是竞争关系,而是同一物理世界基座模型的两条路径。完美世界模型本身是个悖论,所以小鹏让两者在同一基座中通过self-play相互博弈,逐步逼近真实物理世界的上限。"
一个优秀的世界模型,需要具备三个核心能力:主动思考、可控生成、长时序推演。而这也是小鹏X系列的研发脉络——X-Mind攻克"想清楚"(主动思考与可解释推理),X-World解决"生成得准"(可控场景生成),X-Foresight负责"看得远"(长时序推演)。
这三者共同构成了小鹏物理AI基座模型,让车不仅学习"如何行动",也能理解"行动之后世界会如何变化"。
或许X-Mind技术框架,就是小鹏补齐物理AI基座模型的关键拼图。
#小鹏世界模型已进化出预测未来能力##小鹏纯视觉技术论文获得国际认可#
