瘦驼 26-03-05 23:16
微博认证:2024微博年度新知博主 科学科普博主

有些伟大的跨越,是以不积跬步无以至千里的方式实现的。新闻稿是这样写的:“小鹏汽车于广州总部宣布全新第二代VLA(Vision-Language-Action) 技术率先落地。小鹏汽车表示,第二代VLA是其全栈自研的物理世界基座模型,开创性地将传统的VLA模型简化为“V-A”架构,并且该模型除了可以应用在自动驾驶领域,还可以泛化到Robotaxi、飞行汽车和人形机器人等相关领域。”这段像火星文的文字,说的就是一件新华社点赞的大事---自动驾驶的“操作系统”的一次重大升级。
过去的自动驾驶更像在做题。车先把外面拍成一堆信息——车道线、行人、红绿灯、障碍物,也就是(视觉V),系统再把这些信息拆成条条公式、按部就班算出结果,也就是(语言L),最后才动方向盘、踩油门、踩刹车。感知、理解、规划、控制,也就是(行动A),一环一环像流水线,结果常常给人一种机械感。
VLA 2.0 要做的,就是把这条流水线打通。从 VLA(Vision-Language-Action)往更直接的 VA(Vision-Action)走。简单来说,就是:看见了,直接去做。像个有经验的司机那样,看到前车慢下来,顺手松油门;看到行人靠近斑马线,下意识准备刹车。这些并不是每次都在算公式,而是多年开车经验累出来的反应。
小鹏是在把这种“直觉”训练到模型里。通过堆大量真实道路数据,让神经网络在复杂场景下直接触发动作,而不是再把世界先翻译成一堆符号、再算一堆规则。于是你上路时会有种感觉:这车不像在执行程序,更像是跟你一起稳当的老司机。
更重要的是,这套思路不是只让汽车变聪明。小鹏把模型、算力、数据和硬件捏在一块儿——同一套“大脑”未来可以用在不同形态的机器上,飞行器、机器人也能通用。这种“物理直觉”的觉醒,正是中国科技现在最硬核的底气。
在大家都在谈论自动驾驶元年的时候,小鹏给出的答案不是堆砌雷达数量,而是定义了一套全新的“中国公式”。这种领先是带有“代际感”的,当全球最强的特斯拉 FSD 还在磨炼直觉时,我们已经在短短 4 个月里完成了 468 个版本的自我进化。这种恐怖的迭代速度,让中国智驾在这一刻实现了“断代式”的跨越。
现在的中国新能源车,已经不仅仅是在电池和电机上领军全球,我们正在输出的是关于未来的“智慧灵魂”。这种强大,不是靠喊出来的,而是当小鹏的量产车在没有人驾驶的情况下,依然能丝滑地在复杂街头接送乘客时,那种从容且伟大的“中国答案”。
这不仅是小鹏的跨越,更是中国科技在全球赛场上的巅峰跃迁。#新华社点赞小鹏第二代VLA换道超车##新华社评小鹏与特斯拉全球直接竞争#

发布于 广东