姬永锋
23-02-18 18:52 微博认证:财经博主

解读特斯拉 HW4.0:二代 FSD 与英伟达 Orin 比,谁更优秀?(中)
摘自 周彦武 汽车之心

特斯拉 HW4.0 正面 PCB 如下图第一个,Green 在推特上说二代 FSD 的 CPU 内核由 12 个增加至 20 个,运行频率在 1.37GHz-2.35GHz 之间。

初代 FSD 使用了 12 个 ARM Cortex-A72 CPU 内核。

A72 是 ARM 在 2015 年推出的架构,性能大约为 6.1-6.5DMIPS/MHz,最高运行频率差不多也是 2.4GHz,像后来推出的 A76、A77、A78 最高运行频率可以达到 3GHz 以上。

从搭载 CPU 的性能来看,这也反证特斯拉 HW4.0 使用的还是 2015 年的 A72。

按初代频率 2.2GHz 计算,20 内核 A72 的算力是 20*2.2K*6.5=286K,与英伟达 Orin 的 12 核心 A78AE 比稍微低一点,Orin 是 300K DMIPS。

与 HW3.0 相比,HW4.0 一个明显的区别是 HW4.0 元件更多。

HW4.0 上下还各多了 24 路供电,尤其下面的 12 路供电,电感体积颇大,并联的钽电容阵列也颇为壮观(大概率是松下的高精度钽电容)。

HW3.0 的供电只有 4 路,HW4.0 则多了 20 路。我个人推测是因为二代 FSD 的功率大幅度增加了,估计每片二代 FSD 的功率是 80-90 瓦,甚至有可能是 100-120 瓦,否则没必要增加这么多路供电。

这同样也反证了二代 FSD 采用的是 7 纳米工艺。

为什么这么说?

这实际上与电脑主板供电类似。

上图是典型的电脑主板,完整的 CPU 供电设计一般都需要包含上述部分。

PWM 芯片起到总控制作用,每一相完整的供电都是由:

1-2 个电感(一般是并联或倍相的情形)

1-4 个 MOS(一般是高级的 Dr.MOS/2~4 个就是常规的上桥+下桥)

数个滤波电容(中低端主板固态电容,高端主板用钽电容)等构成

电脑主板供电和车载运算系统供电是完全相同的:一般是开关电路。

开关电路是控制开关管开通和关断的时间和比率,维持稳定输出电压的一种供电系统,主要由电容、电感线圈、MosFET 场效应管以及 PWM 脉冲宽度调制 IC 组成。

这一电路系统发热量低,转换效率高,而且稳压范围大、稳压效果好。

一般来说,功率 65 瓦的电脑 CPU 一般是 4 相或者 6 相供电,250 瓦的显卡一般需要 8 相供电,500 瓦的 RTX 4070 Ti 显卡一般是 12+3(12 路 GPU,3 路显存),更为高级的是 16+4 路。

多相供电的好处很多:

提供更大的电流;

降低供电电路的温度,因为电流多了一路分流,每个器件的发热量自然减少了。多相供电电路可以非常精确地平衡各相供电电路输出的电流,以维持各功率组件的热平衡;

利用多相供电获得的核心电压信号也比单相的来得稳定。

但多相供电的缺点是成本较高,而且对布线设计、散热的要求也更高,因此功率越大的产品所用的供电相数越多。

特斯拉使用了 24 相供电(估计两颗 FSD 是 18 路,6 路是显存的),尽管采用了水冷,推测两颗 FSD 的功率仍然有大约 150-200 瓦。

而 Orin 是多少呢?顶配 64GB 的 Orin AGX 最大功率为 60 瓦。

与 HW3.0 不同,HW4.0 的背板多了 8 颗内存,FPGA 代号为 D9ZPR,实际型号是 MT61M512M32KPA-14 AAT:C,特斯拉不惜血本,用上了最顶级的 GDDR6。

GDDR 是 Graphics Double Data Rate 的缩写,为显存的一种。

GDDR 有专属的工作频率、时钟频率、电压,因此与市面上标准的 DDR 存储器有所差异,与普通 DDR 内存不同且不能共用。

一般来说,GDDR 比主内存中使用的普通 DDR 存储器时钟频率更高,发热量更小,更适合搭配高端显示芯片。

GDDR 则是电脑爱好者熟悉的高级显存,GDDR6 是英伟达 2018 年发布 20 系列显卡才开始出现的。

目前最强的消费级内存是 2020 年英伟达携手美光推出的 GDDR6X。

不过和 AI 训练用芯片普遍使用的 HBM2 内存还是差距明显,当然了,HBM2 价格远高于 GDDR6X。

车载领域目前都是 LPDDR,特斯拉又开创先河:第一次在车载领域用 GDRR。

为什么之前没有车企使用?

一是算力需求不高;二是 GDDR 功耗高,用于车载领域并不适合。

不过特斯拉不在意,台式机的 GPU 都敢放在车里,更不用说功耗略高的 GDDR 了。

GDDR6 最高运行频率远高于 LPDDR5,最高可达 1750MHz,传输速率大约是 12800MT/s,是 LPDDR5 的两倍,代价是——功耗也差不多是 LPDDR5 的两倍。

特斯拉不惜血本,用了 16 颗 GDDR6,总计 32GB,仅此一项成本就有大约 200-250 美元,HW3.0 则是 8 颗 LPDDR4,总容量 16GB,估计要 20 美元。

Flash 存储方面,HW3.0 是东芝的 THGAF8G8T23BAIL,这是 32GB 的 UFS,不过是较为陈旧的 UFS2.1 标准。HW4.0 改用三星的 KLUDG8J1ZD,容量提高到 128GB,但依旧是 UFS2.1 标准。

发布于 河南