看 RoboX 的文章，学习了一下维他动力首款产品的信息和背后的思路，发条微博记录一下。- 维他动力的机器人，底层电子电气架构主要由「智能本体域」和「智能交互域」2 个域控组成，也就是一个负责自身控制，一个负责对外的交互。这个也是维他动力创始人余轶南给出的判断，余轶南认为，下一代汽车也

看 RoboX 的文章，学习了一下维他动力首款产品的信息和背后的思路，发条微博记录一下。

- 维他动力的机器人，底层电子电气架构主要由「智能本体域」和「智能交互域」2 个域控组成，也就是一个负责自身控制，一个负责对外的交互。

这个也是维他动力创始人余轶南给出的判断，余轶南认为，下一代汽车也会变成「智能本体域」+「智能交互域」的组合。

还有个让我很意外的地方是，维他动力联合创始人赵哲伦在采访中提到，原来的四足机器人，可能每条腿都需要各自运算。

- VBot 样机的电池容量达到了 700 Wh，续航能到 4 个小时。

之前维他动力官博透露，他们会和亿纬锂能合作机器人高性能动力电池，对于机器人、机器狗来说「能源」是很重要的。

- VBot 的核心传感器是一组前视双目摄像头 + 一颗禾赛的 JT 激光雷达。

和禾赛的合作，之前就已经官宣过了，感觉这个方案一旦定下来，相当于确定了以后的技术路线，这个也是和现在支持辅助驾驶的车区别最大的一个地方。

首先机器人的使用场景肯定比汽车要更复杂，所以激光雷达还是需要的，这样面对更多不规则障碍物可以有更好的感知能力。

视觉感知方面，车的思路是用 7 颗或者更多的摄像头，覆盖车周身的感知，但是机器人/机器狗的思路更像人。

只有一组双目摄像头，和人眼一样，然后通过给摄像头加个「脖子」做到和人一样，可以通过扭头抬头获得更广的视角。

人的视野范围是 150°，有了脖子之后，左右视角可以拓展到 180°-320°，上下可以拓展到 200°。

VBot 双目摄像头的水平视野是 150°，垂直视野是 80°，有了「脖子」之后，视角会拓展到 230° 和 125°。

哲伦在采访的时候也提到了，「我们在一开始去考虑机器人的长期架构时，就希望精简。」

这么做最大的好处除了可以在硬件上降本以外，分配到每百万像素的算力也可以更高。

这个应该也是机器人和车一个很大的区别，车其实可以不那么考虑功耗，可以堆更多的传感器、更高的算力，对于车的电池也更大。

但是对于机器狗、机器人来说，本身的体积有限，能放的电池也有限，相比电动汽车，「能量」会更加珍贵。

- VBot 采用地瓜机器人 S100P 计算平台，最高算力 128TOPS。

地瓜机器人也是维他动力的合作伙伴，负责机器人端侧 AI 算力及中央计算。

地瓜机器人是地平线的子公司，提供底层芯片和软件平台，盲猜芯片是地平线 J6M。

- 交互

交互这点很有意思，这个和「智能汽车」相比，是一个全新的，也是更重要的课题。

首先这个交互和智能汽车一样，会由 2 块构成。

一块就是 for 智能驾驶的（自主行动），主要依靠视觉（看）；另一块是 for 座舱需求的（用户交流），主要靠语音（听）。

关于自主行动，我接触过的机器狗宇树，主要是靠遥控。

余轶南的想法是「甩掉遥控器」是自主移动的关键一步，一旦这个行为变为「自主的」，那对自生的感知能力要求就会比较高。

所以维他动力也给 VBot 装上了这个级别算力最高的芯片。

从演示视频里来看，VBot 支持用绳子牵着走，也支持带个发射器，让机器狗跟着发射器走。

关于和人的交互，哲轮班长在采访里表示：「由于人与机器人的距离通常比手机、电脑都远，所以人与机器人最好的交互方式，就是自然交互。

我们认为机器人应该是一个全模态的交互方式，在感知层面，你的视觉、听觉还有触觉都能够作为 input，在 Agent 架构里进行分析，然后通过我们的屏幕、肢体和扬声器，以及机器人耳朵上的指示灯去表达情绪。」

背后的技术架构上，余轶南的看法是：「不管是对于自动驾驶还是机器人，快系统+慢系统、大脑+小脑结合的方式，都会是未来的主流技术架构。」

所以，维他动力为机器人开发了一套 1B 左右的中小规模 VLA 模型，这个不仅会接收 Agent 对任务的需求，同时接入对环境感知以及机器人本体的信息。

看完上面这些内容，对维他动力首款产品的产品思路已经比较了解了。

现在市面上有助攻情绪价值的机器人（LOVOT），也有主打运动控制的机器人（宇树），维他动力的 VBot 有点把这两者结合起来的意思。

最后落地的状态就看算法能力了，接下来的节奏是：

9月：启动制造工厂

10月：开启量产级早鸟内测

年底（12月）：完成产品上市

发布于上海