#李想称机器人也用VLA##理想发布下一代自动驾驶基础模型##李想回应AI时代的焦虑# 3月17日,理想汽车基座模型负责人詹锟亮相NVIDIA GTC 2026,发布下一代自动驾驶基座模型MindVLA-o1。该架构以原生多模态MoE Transformer为核心,通过五大技术创新——3D空间理解、多模态思考、统一行为生成、闭环强化学习和软硬件协同设计,构建了面向物理世界智能的自动驾驶基础模型。
当前具身AI本质上仍在“看2D视频”,更像是一个人坐在电脑前学着开车,然后再到路上去开车,而人类理解世界的方式,是在3D空间中通过真实感知建立空间认知。MindVLA-o1的3D视觉模型正是为了解决这一根本问题。李想表示,这套基座模型不只是为自动驾驶设计的。同一套VLA基座模型,能开车,也能控制机器人,它正在逐渐演化成一个通用的物理世界智能体。
截至2025年底,理想VLA司机大模型月使用率已达80%,VLA指令累计使用超1225万次。在中国智能汽车产业加速迈向智能化下半场的进程中,理想汽车正以自主技术研发为支点,探索一条从智能出行延伸至具身智能的产业新路径。#理想MindVLA能否让AI真正理解物理世界##理想汽车的VLA大模型用户使用率已达80%#
