63充电中
25-08-11 23:32 微博认证:汽车博主 微博原创视频博主

看 RoboX 的文章,学习了一下维他动力首款产品的信息和背后的思路,发条微博记录一下。

- 维他动力的机器人,底层电子电气架构主要由「智能本体域」和「智能交互域」2 个域控组成,也就是一个负责自身控制,一个负责对外的交互。

这个也是维他动力创始人余轶南给出的判断,余轶南认为,下一代汽车也会变成「智能本体域」+「智能交互域」的组合。

还有个让我很意外的地方是,维他动力联合创始人赵哲伦在采访中提到,原来的四足机器人,可能每条腿都需要各自运算。

- VBot 样机的电池容量达到了 700 Wh,续航能到 4 个小时。

之前维他动力官博透露,他们会和亿纬锂能合作机器人高性能动力电池,对于机器人、机器狗来说「能源」是很重要的。

- VBot 的核心传感器是一组前视双目摄像头 + 一颗禾赛的 JT 激光雷达。

和禾赛的合作,之前就已经官宣过了,感觉这个方案一旦定下来,相当于确定了以后的技术路线,这个也是和现在支持辅助驾驶的车区别最大的一个地方。

首先机器人的使用场景肯定比汽车要更复杂,所以激光雷达还是需要的,这样面对更多不规则障碍物可以有更好的感知能力。

视觉感知方面,车的思路是用 7 颗或者更多的摄像头,覆盖车周身的感知,但是机器人/机器狗的思路更像人。

只有一组双目摄像头,和人眼一样,然后通过给摄像头加个「脖子」做到和人一样,可以通过扭头抬头获得更广的视角。

人的视野范围是 150°,有了脖子之后,左右视角可以拓展到 180°-320°,上下可以拓展到 200°。

VBot 双目摄像头的水平视野是 150°,垂直视野是 80°,有了「脖子」之后,视角会拓展到 230° 和 125°。

哲伦在采访的时候也提到了,「我们在一开始去考虑机器人的长期架构时,就希望精简。」

这么做最大的好处除了可以在硬件上降本以外,分配到每百万像素的算力也可以更高。

这个应该也是机器人和车一个很大的区别,车其实可以不那么考虑功耗,可以堆更多的传感器、更高的算力,对于车的电池也更大。

但是对于机器狗、机器人来说,本身的体积有限,能放的电池也有限,相比电动汽车,「能量」会更加珍贵。

- VBot 采用地瓜机器人 S100P 计算平台,最高算力 128TOPS。

地瓜机器人也是维他动力的合作伙伴,负责机器人端侧 AI 算力及中央计算。

地瓜机器人是地平线的子公司,提供底层芯片和软件平台,盲猜芯片是地平线 J6M。

- 交互

交互这点很有意思,这个和「智能汽车」相比,是一个全新的,也是更重要的课题。

首先这个交互和智能汽车一样,会由 2 块构成。

一块就是 for 智能驾驶的(自主行动),主要依靠视觉(看);另一块是 for 座舱需求的(用户交流),主要靠语音(听)。

关于自主行动,我接触过的机器狗宇树,主要是靠遥控。

余轶南的想法是「甩掉遥控器」是自主移动的关键一步,一旦这个行为变为「自主的」,那对自生的感知能力要求就会比较高。

所以维他动力也给 VBot 装上了这个级别算力最高的芯片。

从演示视频里来看,VBot 支持用绳子牵着走,也支持带个发射器,让机器狗跟着发射器走。

关于和人的交互,哲轮班长在采访里表示:「由于人与机器人的距离通常比手机、电脑都远,所以人与机器人最好的交互方式,就是自然交互。

我们认为机器人应该是一个全模态的交互方式,在感知层面,你的视觉、听觉还有触觉都能够作为 input,在 Agent 架构里进行分析,然后通过我们的屏幕、肢体和扬声器,以及机器人耳朵上的指示灯去表达情绪。」

背后的技术架构上,余轶南的看法是:「不管是对于自动驾驶还是机器人,快系统+慢系统、大脑+小脑结合的方式,都会是未来的主流技术架构。」

所以,维他动力为机器人开发了一套 1B 左右的中小规模 VLA 模型,这个不仅会接收 Agent 对任务的需求,同时接入对环境感知以及机器人本体的信息。

看完上面这些内容,对维他动力首款产品的产品思路已经比较了解了。

现在市面上有助攻情绪价值的机器人(LOVOT),也有主打运动控制的机器人(宇树),维他动力的 VBot 有点把这两者结合起来的意思。

最后落地的状态就看算法能力了,接下来的节奏是:

9月:启动制造工厂

10月:开启量产级早鸟内测

年底(12月):完成产品上市

发布于 上海