扬韬 26-03-10 22:17
微博认证:职业投资者 孙成刚

小鹏智驾封神:学霸是怎样炼成的

2026年3月9日,股市因美伊战事升级而大跌,一些炒家却忙着“炒龙虾”,所谓的龙虾概念股大面积封着涨停。而我,到僻静的虹桥去“养龙虾”了。

没错,小鹏的智驾系统升级为VLA 2.0之后,小鹏智能汽车,就不再是简单的交通工具,而变成了智能汽车,是世界上移动速度最快的机器人,是世界上最早取得突破性进展的“小龙虾”。

小鹏为试驾的自媒体设计了两条路线,分别是在嘉定和松江。路线看着挺复杂,但我没啥兴趣,直接选择了自己事先确定的道路——先到浦东后到浦西,走高架下城区,走最拥挤的小路,看看它到底怎么样。

结果,我没感觉。

挑不出毛病。这VLA 2.0,就是一个有30年驾龄的老司机。把车交给它,真的不用操心了。从虹桥到浦东的50分钟,我全程不干预,就看着它从容不迫地按照指定路线上高架、变道、超车、下隧道、进车库、绕锥桶、躲行人,在自行车与摩托车流中穿行。整个过程,你感觉不到以前的机器开车刹车的顿挫。加油很顺畅,刹停很丝滑。(顺便说一下,我开回来的时候,只要眼睛看着路,双手不放在方向盘上,它也不再提示了。只有我眼睛看手机做别的事情,它才会马上提醒,要求我手放在方向盘上。这是VLA 2.0的水平。我相信,L4级别智驾推出后,双手双脚和双眼,将得到彻底的解放。)

让人没感觉的科技,才是真科技。

我开智驾一年半了,虽然我把小鹏智驾说的花好月圆,但我夫人从来没用过智驾系统。每次使用智驾,她还是想挑出一点毛病。而这次,她坐在副驾,跟我一起体验了城区快速道和最拥挤的南泉北路一段路,最后直接给小P封神:这不像机器开的车,像老司机。这个车,值得买!于是,她开始学习智驾知识,很快通过了小鹏汽车的智驾考试,下一步,等我的X9取到车,她就将一试身手了!

让她感到惊讶的场景之一,是下面这个视频。在南泉北路靠近第一八佰伴的双向单车道,前车临时刹停接客人,司机还下车帮着打开后备箱,然后再打开门回车里。如果是老司机,也许会瞅着空隙绕过去的。而此前的所有智驾系统,都会停在后面礼让。小鹏VLA 2.0呢,在这里缓慢行走观察,并瞅准了一个最佳的机会,在司机即将进入车内之前,擦着车门就过去了。看视频中38秒的那个瞬间,只有一个字:神。

这个瞬间难在哪里呢?车的形状、车门和后备箱打开关闭,这都可以识别。车门打开的瞬间加上一个司机,这是极其不规则的形状,且周围还有车辆在行驶,要掐准时点,在前车敞开车门而司机即将上车的那一瞬间,能判断出这个时点是安全,并加速超过,这一套复杂的过程,是以往任何一家车企都无法解决的。

小鹏做到了。

不止如此,在视频的1′03″到1′20秒的过程中,又经历了一次短时间的快速博弈:单车道,前车停车堵住了通道,对向来了大公交车,这里显然无法顺利通过。小鹏耐心等前车移动,但在它启动的瞬间,对面左侧来了一辆摩托车,冲着车头过来了,然后逆行进入反向车道,紧接着,右手侧竟然又冒出一辆摩托车,超过车头再变道,向前跑了。此时,小鹏开始加速,正常前行。全程无顿挫,无急刹,一切尽在掌握中。

类似情况还有很多。我作为一个“资深智驾爱好者”,过去一年半,几乎每天都在使用智驾,智驾累计行程也已经超过2万公里。我深知目前的智驾系统短板在哪里。春节期间开车3500多公里,我能让智驾运行99%,我对智驾的理解是足够到位的。目前,小鹏的智驾系统在高速路上是无敌的存在,可以完全放心。它原来的短板就是窄道博弈过于注重安全距离,顿刹的情况经常出现,且在极其复杂的场景会一脸懵逼,停在原地不动了。这也是几乎所有车企都存在的短板。而这一次,小鹏VLA 2.0,彻底解决了这一问题。

这一难题解决后,小鹏的智驾系统立刻就跟国内和国际上所有的车企都拉开了断代式的差距。从这一刻开始,中国大地上的智驾系统就只有两类:小鹏的和其它的,其它车企中能与小鹏比肩但存在显著不足的,只有两家:特斯拉和鸿蒙智行。

特斯拉有两点根本无法与小鹏比拟:它是收费的,原来的基础费用要6万元且年费要上万元,而小鹏车主是完全免费的。其二,特斯拉迄今为止都没有在中国进行数据训练,这使得它在中国甚至无法与二流智驾系统进行竞争,经常跑错路、经常违章,是它最大的短板。

鸿蒙智行目前的最大短板也是两点。其一,它坚持激光雷达模式,由此甚至让一些车企故意炫耀激光雷达,完全无视激光雷达在未来智驾中的巨大弊端。其二,它在不少地方,仍是规则运行的模式。比如,车库的扫图,遵守交规的相关规则等。激光雷达和规则模式,是早已被特斯拉和小鹏都放弃了的。其弊端一句话就能说清楚:不适应未来的大模型算力时代。

小鹏汽车智驾系统的封神之路,经过了这么几个过程:

第一,高精地图+规则时代。最初的智驾系统,大家都以为必须依靠高精地图,必须穷尽规则。但高精地图的缺陷显而易见,无法覆盖全国所有路径。规则本就无法穷尽,即便穷尽,也绝对无法应对所有的异常状况。在这个阶段,用激光雷达,只是地图和规则的补充而已。越早放弃激光雷达,会越早摆脱负担。

第二,端到端到VLA时代。端到端,就是它走过的路都会走,只要有路就一定可以走。这使得它在高速路和城市主干道路所向披靡,在窄路和地下车库等角落,应用纯视觉加语言和决策模型补充,也可以解决99%的场景。但面对突发异常状况,仍然有短板。目前,国内和国际上几乎所有车企,都走在这条路上。无人驾驶出租车则仍然依赖地图和规则,有的企业加上了VLA模型,但繁多的激光雷达,却成为了它们的短板.

第三,VLA 2.0时代。这是一个不再依赖地图,不再依赖单纯的视觉感知模型,不再依赖往常记忆的时代,它要做到的,就是没有路,也可以走。没有经历过的场景,也可以动脑子解决。没有见到的障碍,也可以规避。而这,靠的是小鹏汽车全栈自研的世界基座大模型和物理AI体系。

小鹏汽车在VLA 2.0时代的封神,是学渣变成学霸进而变成学神的过程,就像一个天才的学神一样,它必须经过了这样几个流程:

1、预习(预训练)。小鹏汽车通过自建的世界基座大模型,将海量场景搬上云端,进行预训练。这就像好学生上课一定会先预习一样,先知道世界是什么样的,怎么做才会理解和领会。这个预训练的过程,难度之大,秒杀一切规则时代的车企。你要有大数据、要有大算力、要有高效的大模型。小鹏汽车的预训练,模拟的仿真场景从一年前的3万个扩增到如今的50万个,模拟训练量相当于实车每天跑了3000万公里。这个模拟工作量有多大呢?去年数据,全国大模型调用量约等于0.737万亿Token,而小鹏20万台车每日调用数据量高达58.8万亿Token,是全国数字AI日调用量的80倍。

2、上课(强化训练)。这是一个基于世界模型的强化学习训练过程,是内部的自我博弈,将第二代VLA与世界模型实时进行交互,让智驾系统学会各种场景的应对模式。比如,向左变道,这么一个简单场景,小鹏在云端提供了海量的变道可能性,系统必须熟悉每一个可能性,并博弈出最佳策略。这有点像武侠小说中的“左右互搏”,又有点像阿尔法狗在学习围棋过程中的“自我对弈”。只有这样,才会有最佳策略浮现出来。

3、复习和训练(蒸馏与实用)。需要指出的是,前述过程,完全是云端仿真的。小鹏能做到的,是把全国、全世界所有的道路和场景图片喂给大模型,让它在仿真环境中博弈。最佳策略出现后,云端模型会蒸馏出成熟模型到车端,从而降低云端的工作负荷、提升车端的反应时效。这样做的目的,就是要达到“什么路都能开”、“什么场景都能开”。

经过这么几个流程之后,小鹏智驾系统才会进化到VLA 2.0时代。这才是小鹏智驾系统的终极目标:自动驾驶的本质是物理AI问题。这是一个远高于传统大模型的新时代。传统的大模型,只是处理语言、文字、图片、视频,进行逻辑推理归纳演绎,就能输出结果。而物理AI则要求看得到、听得到、想得到,能决策,还要做得到。智驾不能只输出决策文档,而必须执行决策指令,并且要做到车身、乘客都舒适。它需要调动的系统,跟传统模型去比,是几何指数级的升高。

于是,我们就能理解下面的公式了:
自动驾驶能力=模型×算力×数据×本体

即自动驾驶的能力和水平,将取决于大模型水平的高低、系统算力的多少、提供数据的多少和车端本体的响应能力。

大模型:世界上最厉害的大模型,无非就是大家耳熟能详的Deepseek、OpenAI以及豆包、元宝、千问等。智驾系统训练用的大模型,国内还只有小鹏率先完成了“世界基座大模型”。注意,这不是只针对车端的,它是可以通用到机器人、低空飞行器上的,靠数据非结构化、信号连续和真实世界交互,可以做到一套模型,(物理)世界通用。所以,解决了这个大模型,就解决了智能座舱、智能驾驶、具身智能机器人和飞行汽车的空间行动力。

大算力:算力不是吹吹就好了的,要看有效算力的高低。

有效算力=名义算力×算力利用率。

小鹏解决了图灵芯片与相关的大模型。图灵芯片是小鹏汽车全栈自研的。目前能自己研发专用汽车芯片的企业,寥寥无几。如果使用常规芯片,计算利用率只有22.8%,而图灵芯片的利用率可以达到82.5%。在名义算力方面,一颗图灵芯片只相当于3颗Orin-X芯片。而在实际算力方面,一颗图灵芯片相当于10颗Orin-X。它将原来的推理时延从800毫秒大幅度缩短到80毫秒。

大数据。数据量方面,小鹏汽车用于模型预训练的数据是50PB,相当于5000万GB。这个数据有多大呢,大约等于1000万部超高清电影。数据密度方面,小鹏车机每秒可以处理53亿字节的视觉数据。在这样的数据量下,它才能日调用58.8万亿Token。由此,半年之内,小鹏的智驾系统升级468个版本。
这样带来的小鹏智驾效率指数级提升——

安全接管里程提升50倍;
平均接管里程提升25倍;
综合通⾏效率 提高23%;

这就是小鹏VLA 2.0的学霸炼成之路。

如今,传统的智驾与小鹏智驾的最大区别是:

1、面对特殊场景:传统智驾是学渣——这个情况,我没见过,我不会开,于是,刹停等待。VLA 2.0是学霸——这个情况,我没见过,但我能分析,我能开,我试着开。

2、面对传统场景异常现象:传统智驾是学渣——这个情况我学过,我应该会,但这个条件发生变化了,我不知道怎么办,求接管。VLA 2.0是学霸——这个情况,多了一种变化,我似曾相识,且让我试试,没问题。

3、面对无路无图无网络的场景:传统智驾是学渣——这个是高考数学最后一道大题,不是我的菜,我求接管。VLA 2.0是学霸——呵呵,这是送分题,交给我吧。一定要注意,小鹏的VLA 2.0无论走到世界哪个角落,即便没有网络没有信号,它也可以开!

4、面对乘客舒适度体验:传统智驾是学渣——这次我反正能过,你别管我怎么过的,至于乘客是恶心呕吐还是晕车,这都不是我的事儿,我只管开车。VLA 2.0是学霸——这次不管啥场景,我的第一目标是让乘客舒适,否则还要我干什么呢?

5、面对未来场景:传统智驾是学渣——我只管开车,其它与我无关。VLA 2.0是学霸——我能一边开车,一边跟你海阔天空地聊天,回答你一切问题,提供情绪价值。我能帮乘客打开各种智能体(AI模型),帮助乘客养龙虾。没事了,我可以出去跑出租车。闲下来,我可以自己去充电。我还能跟别的车打招呼,从他们那里了解哪个充电桩更便宜,帮助车主省钱……因为,我本来就是智能机器人啊。

所以,当学渣和学霸面对面,根本就不是一个数量级。学渣说,我能多花点时间,多用点心,迎头赶上去。学霸说,随便,我有天才的头脑(芯片),有海量的数据,有超大的算力,有足够多的仿真场景和训练内容,你学习,我也在加速学习。你要赶上我,欢迎,加油吧,学渣。

小鹏VLA 2.0来了。这是一个划时代的开端。学霸上路,谁与争锋?

更重要的是,小鹏这套系统,即将有效应用于人形机器人、低空飞行汽车。一套系统,多端应用,这才是真小鹏。

最后,说点题外话。这次小鹏邀请自媒体去试驾,没有提供陪伴人员,让我随便开,随便走,到点还车就行了。为了表示诚意,他们在试驾车上放了两块德芙巧克力,吃起来很丝滑。为了进一步表示诚意,他们愿意报销午餐,每人100元,但是需要提供发票。哦,我是打车去的,他们说可以报销打车费,但需要提供行程单和发票。最后,我啥也没有提供,一分钱也没让他们花——面对这么抠门的公关部门的行动,作为股东,我感到很欣慰。只是,看着他们宣发部门的理工男一般的木头,我实在有点着急,所以,赶紧花了点时间,写了这篇文章,帮他们宣传一下吧。

新的时代,要来了。#小鹏第二代VLA拉开代际差的时刻到了##小鹏第二代VLA妈妈都爱开的国民智驾# http://t.cn/AXV9UYao

发布于 上海