第一电动网
26-06-16 14:28 微博认证:第一电动网(www.d1ev.com)官方微博

昨天理想Livis Day上提到了三个关键词:马赫VLA、马赫Mind-Edge和马赫Mind-Pro,这三者的关系该如何理解呢?
目前的理解是:马赫VLA是“眼睛和耳朵”(感知与理解),马赫Mind-Edge是“小脑和手脚”(快速反应与执行),马赫Mind-Pro是“大脑皮层”(深度思考与决策)。

马赫VLA(视觉-语言-动作大模型):负责看懂世界。它是一个多模态感知模型,融合了激光雷达、摄像头、毫米波雷达等40个传感器的数据,能像人一样“看见”并“理解”周围环境——比如识别出前方是“一辆打着双闪的故障车”还是“一个正在过马路的老人”,甚至能看懂交警的手势。它的核心能力是环境感知与语义理解,输出的是“这个场景是什么”。

马赫Mind-Edge(端侧具身智能体):负责快速行动。它直接部署在车端,接收到VLA的感知结果后,能像本能反应一样直接输出控制指令——打方向盘、踩刹车、加速——延迟仅0.2秒,比人类快56%。它的核心能力是实时控制与执行,输出的是“现在该做什么动作”。

马赫Mind-Pro(基座大模型):负责深度推理。它擅长处理复杂的逻辑问题,比如规划长途路线、理解用户模糊的语音指令(“我有点冷”)、或者在极端情况下推算出“最安全的逃生轨迹”。它的核心能力是复杂决策与推理,输出的是“最优方案是什么”。

简单反射走Mind-Edge(快),复杂规划走Mind-Pro(准),VLA全程提供感知输入。#理想具身智能##理想汽车[超话]#

发布于 北京