小鹏第二代VLA技术落地

有些伟大的跨越，是以不积跬步无以至千里的方式实现的。新闻稿是这样写的：“小鹏汽车于广州总部宣布全新第二代VLA（Vision-Language-Action) 技术率先落地。小鹏汽车表示，第二代VLA是其全栈自研的物理世界基座模型，开创性地将传统的VLA模型简化为“V-A”架构，并且该模型除了可以应用在自动驾驶领域，还可以泛化到Robotaxi、飞行汽车和人形机器人等相关领域。”这段像火星文的文字，说的就是一件新华社点赞的大事---自动驾驶的“操作系统”的一次重大升级。
过去的自动驾驶更像在做题。车先把外面拍成一堆信息——车道线、行人、红绿灯、障碍物，也就是（视觉V），系统再把这些信息拆成条条公式、按部就班算出结果，也就是（语言L），最后才动方向盘、踩油门、踩刹车。感知、理解、规划、控制，也就是（行动A），一环一环像流水线，结果常常给人一种机械感。
VLA 2.0 要做的，就是把这条流水线打通。从 VLA（Vision-Language-Action）往更直接的 VA（Vision-Action）走。简单来说，就是：看见了，直接去做。像个有经验的司机那样，看到前车慢下来，顺手松油门；看到行人靠近斑马线，下意识准备刹车。这些并不是每次都在算公式，而是多年开车经验累出来的反应。
小鹏是在把这种“直觉”训练到模型里。通过堆大量真实道路数据，让神经网络在复杂场景下直接触发动作，而不是再把世界先翻译成一堆符号、再算一堆规则。于是你上路时会有种感觉：这车不像在执行程序，更像是跟你一起稳当的老司机。
更重要的是，这套思路不是只让汽车变聪明。小鹏把模型、算力、数据和硬件捏在一块儿——同一套“大脑”未来可以用在不同形态的机器上，飞行器、机器人也能通用。这种“物理直觉”的觉醒，正是中国科技现在最硬核的底气。
在大家都在谈论自动驾驶元年的时候，小鹏给出的答案不是堆砌雷达数量，而是定义了一套全新的“中国公式”。这种领先是带有“代际感”的，当全球最强的特斯拉 FSD 还在磨炼直觉时，我们已经在短短 4 个月里完成了 468 个版本的自我进化。这种恐怖的迭代速度，让中国智驾在这一刻实现了“断代式”的跨越。
现在的中国新能源车，已经不仅仅是在电池和电机上领军全球，我们正在输出的是关于未来的“智慧灵魂”。这种强大，不是靠喊出来的，而是当小鹏的量产车在没有人驾驶的情况下，依然能丝滑地在复杂街头接送乘客时，那种从容且伟大的“中国答案”。
这不仅是小鹏的跨越，更是中国科技在全球赛场上的巅峰跃迁。#新华社点赞小鹏第二代VLA换道超车##新华社评小鹏与特斯拉全球直接竞争#

发布于广东