接地气总结版本来了!
MindVLA-o1自动驾驶基础模型,是其面向物理世界智能的核心技术落地,这套新架构围绕原生多模态设计、端到端控制输出、世界模型应用三大核心特性打造,针对性解决了传统VLA方案的行业痛点。该模型采用原生多模态tokenizer,让视觉与语言成为等价模态,无需将视觉转化为语言,更适配自动驾驶的多模态任务需求;同时以统一VLA架构实现端到端控制,将感知、规划、决策整合在单一模型中,可直接输出横纵向驾驶控制信号。世界模型则在其中承担辅助监督与视觉推理任务,还能支撑云端场景仿真、强化学习与评测,进一步提升模型的泛化能力。
在落地层面,MindVLA-o1实现了行泊一体,行车与泊车采用同一套技术方案,可覆盖行泊衔接、园区地库等多元场景。针对老车型硬件兼容问题,理想采用模型蒸馏技术,让新架构适配Orin、Thor平台,后续也将通过该方法完成M100平台与FP4量化的兼容,保障老车主也能升级最新系统,避免硬件代际差异造成的功能割裂。
此次MindVLA-o1的技术落地,既体现了理想在自动驾驶领域的工程化能力,也让其通用物理世界基础模型的技术路径更清晰,为后续向机器人等具身智能场景拓展筑牢了技术基础。
#理想汽车##影总聊智驾##微博新知#
发布于 浙江
