理想TOP2 26-02-09 19:20

李想: 全新L9双马赫100芯片有效算力是Thor-U的5-6倍
李想2026年2月9日微博:
全新L9用的马赫100双芯片,总算力2560 TOPS。关键不只是总算力,更要看单颗有效算力:马赫100单颗算力1280 TOPS,因为采用数据流架构提供给算法软件最大的优化空间,单颗马赫100的有效算力就是英伟达Thor U的3倍,全新L9的双马赫100芯片,有效算力就是Thor U的5-6倍了。

什么是有效算力?就是实际跑VLA大模型时,能榨出来的真实性能。传统GPU架构利用率低,我们的数据流架构利用率高、功耗低。

具体表现:同样场景下,我们能做到更高帧率、更短反应时间。紧急情况下,可以更早感知风险,更快做出避险动作——这就是体验代差,不仅是参数好看,是关键时刻管用。

2022年启动自研时,我们就判断:2025年开始,行业进入【自研算法+自研算力】软硬一体时代。马赫100,是这个判断的第一步。

2025年7月22日36氪汽车发文《市值第一英伟达,被中国汽车浇冷水|深氪》
7月23日进行了部分修改,修改后的内容为:
“双方对Thor进行了数轮调整后,才达到量产交付效果。但英伟达原先宣传的700TOPS算力,实际目前可释放的只在500左右。”

2025年7月27日李想微博:
最近几天,关于芯片算力,又想给一些博主发学习资料了:

1. 理想i8和智能焕新版L系列采用的Thor-U芯片,针对不同精度的推理模型,所释放的TOPS数值也不同,精度越高TOPS越低,精度越低TOPS越高。
2. 更高 TOPS 带来更高模型吞吐率,从而降低推理延迟,反应变快。
3. 想要反应快,就需要采用低精度的推理模型。
4. 低精度推理模型,非常考验工程能力,不是每个人都能做到的。
5. 理想汽车的VLA模型目前采用INT8与FP8的混合精度推理,英伟达Thor U芯片目前可提供高达700 TOPS的算力;同时,Thor-U也支持FP4精度推理,未来我们也会将精度逐渐往FP4去优化,从而“压榨”芯片获取更大的算力。

李想这条微博需结合郑小康微博才能更好的理解,25年7月26日郑小康微博:
郎博@郎咸朋 刚刚提到了 Thor-U 的算力:

算力和格式直接相关,如果以 FP16 格式计,那么 Thor-X 是 500 TOPS 。

但理想汽车的 VLA 是 INT8 和 FP8 的混合精度推理的,在这样的格式下,理想汽车采用的 Thor-U 的算力是 700 TOPS,Thor-X 是 1000 TOPS。

但 Thor 平台也支持 FP4,在这种格式下 Thor-U 的算力是 1400 TOPS。

*特斯拉的 FSD 也是 INT8 格式。

即同一个芯片,在不同格式下算力是不同的,英伟达Thor-U 700 TOPS,Thor-X 1000 TOPS是在FP8精度下。
如果是FP16精度,Thor-U 350 TOPS,Thor-X 500TOPS。
如果是FP4精度,Thor-U 1400 TOPS,Thor-X 2000TOPS。

理想的VLA目前是INT8和FP8混合精度推理的,可以实现700TOPS的算力,理想将来将朝着FP4精度去优化,实现1400TOPS算力。
#理想汽车##理想汽车[超话]##李想###理想L9##理想L8##理想L7##理想L6##理想i8##理想i6##理想MEGA#

发布于 四川