#小鹏第二代VLA妈妈都爱开的国民智驾# 仔细研究了小鹏第二代VLA,发现几个有意思的技术选择。
先说参数规模。云端720亿参数,车端跑30亿蒸馏版,INT8量化实时推理。这个压缩比(24:1)在行业里算是激进的。通常大模型蒸馏到车端,掉精度是常态,复杂场景下尤其明显。小鹏敢这么干,底气应该是自研图灵芯片的软硬协同优化——编译器和模型联合调优,推理效率提升12倍,有效算力利用率从22.5%拉到82.5%。这不是算法单点突破,是整套工程体系跑通了。
但我更关注的是数据闭环。50PB训练数据,相当于65000年人类驾驶经验。数字很唬人,但数据质量和多样性比数量更重要。小鹏的数据主要来自国内,全球化部署时,欧洲窄路、美国高速、东南亚摩托流,泛化能力真有那么强?我存疑。另外,数据标注和清洗的成本怎么摊?没细说。
何小鹏说这套模型能跨域——汽车、Robotaxi、机器人、飞行汽车统一智能基底。这个愿景很大,但技术实现上有个坎:视觉输入确实通用,但动作空间完全不同。汽车是方向盘+油门刹车,机器人是关节角度,飞行汽车是三维轨迹。底层特征可能共享,但上层策略网络肯定得分化。是共享编码器、分化策略头,还是完全不同的模型架构?等技术论文拆解吧。
还有个行业趋势。小鹏VLA开始外供,大众成了首发客户,从小鹏的"技术投入"转向"技术创收"。这在国产智驾里算头一个。但外供意味着要适配不同车型、不同传感器配置,复杂度指数级上升。能不能hold住,今年Q1量产见分晓。
我的判断:第二代VLA代表了国产智驾从"功能可用"到"体验好用"的跃迁,但别神话。端到端架构确实提升了流畅度,但安全边界、可解释性、全球化泛化这些硬骨头还没啃完。真正的考验是,当数据边际效益递减时,这套架构还能不能继续进化。
你们觉得呢?端到端智驾是捷径还是弯路?评论区聊聊。 #微博新知##一本书读懂chatgpt#
