#特斯拉[超话]# #新能源汽车# #大v聊车# 昨天发的Ashok的最新演讲视频(http://t.cn/AX54F7jD),其实有相当一部分是重复去年讲过的内容。比如这个高斯溅射。
关于去年的演讲, @TeslaAI 和我都贴了相关文字版。但都没非常直白地讲出来这东西到底是干什么用的。
一句话,这东西是AP组工程师调试FSD用的,车机版本FSD不会跑这东西。整个FSD大模型会有一个输出端,专门输出生成的3D高斯溅射视频,然后工程师可以观察FSD自己看到的周围环境是个啥样子,如果发现和输入的视频不一样,那么大致就知道问题出在什么地方了。
用高斯溅射,甚至之前的NeRF,最让人头疼的其实不是场景还原之后到底和原始视频有多相似/想像,而是这个生成速度。如截图所示,传统的时间是30分钟左右,这肯定没戏,高速场景视频输入,还得等30分钟才能输出一个3D场景,那不把调试工程师给急疯了?所以才有这种优化需求,所以他家最终弄出来的这个220毫秒的才符合这些调试工程师的需求。
那么这个图中说的前馈(Feedforward)是啥意思呢?传统(业界通过论文公布的水平)是需要翻来覆去(多次迭代)才能生成这个3D高斯溅射场景(视频)的,特斯拉的不是这样,就输入视频(摄像头)到输出这个场景(视频),一次搞定(single forward pass,无需逐个场景去迭代优化),这也是导致上面提到的那个220毫秒神速生成的原因。
所以,就算是一个调试输出内容,特斯拉都追求极致速度(当然是实际需求导致他们不得不这样做的)。
至于其它的,你看这个表中的对比就可以了。
你学废了么?@特空间Tspace
发布于 天津
