MindVLA-o1自动驾驶模型发布

接地气总结版本来了！

MindVLA-o1自动驾驶基础模型，是其面向物理世界智能的核心技术落地，这套新架构围绕原生多模态设计、端到端控制输出、世界模型应用三大核心特性打造，针对性解决了传统VLA方案的行业痛点。该模型采用原生多模态tokenizer，让视觉与语言成为等价模态，无需将视觉转化为语言，更适配自动驾驶的多模态任务需求；同时以统一VLA架构实现端到端控制，将感知、规划、决策整合在单一模型中，可直接输出横纵向驾驶控制信号。世界模型则在其中承担辅助监督与视觉推理任务，还能支撑云端场景仿真、强化学习与评测，进一步提升模型的泛化能力。

在落地层面，MindVLA-o1实现了行泊一体，行车与泊车采用同一套技术方案，可覆盖行泊衔接、园区地库等多元场景。针对老车型硬件兼容问题，理想采用模型蒸馏技术，让新架构适配Orin、Thor平台，后续也将通过该方法完成M100平台与FP4量化的兼容，保障老车主也能升级最新系统，避免硬件代际差异造成的功能割裂。

此次MindVLA-o1的技术落地，既体现了理想在自动驾驶领域的工程化能力，也让其通用物理世界基础模型的技术路径更清晰，为后续向机器人等具身智能场景拓展筑牢了技术基础。
#理想汽车##影总聊智驾##微博新知#

发布于浙江