英伟达GTC发布AI工厂

#英伟达的AI工厂# 英伟达召开了一年一度的GTC （GPU技术大会），老黄根本不担心自家的显卡没人用，所以没有太多的弯弯绕绕，只有肌肉感爆棚的性能数据。AI仍然是这次大会的核心，而英伟达想成为一个贯穿AI行业的基建——“AI工厂 ”。

首先是游戏相关的DLSS 5，引入了“实时神经渲染”，直接把AI接入渲染流程中。得到的效果就是让游戏视觉逼近了电影级的真实感，同时还能保持较高的帧率运行。算力需求也是蹭蹭涨， DLSS 5的秋季首发只在50系显卡上。但由于演示图对比过大，也是引发了不少担忧，怕破坏掉原来的美术风格。

好了就介绍了2分钟游戏，后面全是AI。先是Vera Rubin新平台，作为继Blackwell后的新一代架构，这是未来几年英伟达AI算力的核心王牌。在主力Vera Rubin NVL72机柜中，单机架能塞进72颗Rubin GPU + 36颗Vera CPU，训练MoE模型只需上一代Blackwell的1/4 GPU算力，效率飞升，而且已经量产，预计是下半年出货。

老黄更想卖的其实是整合了算力产业的捆绑包，里面除了GPU，还有英伟达自家的CPU，用于信号传输的NVLink 72，以及液冷机架，存储系统，网络系统，安全管控，机架级集成等配套设施。他甚至怕你买了不会使，搞了个虚拟AI工厂，让你先把设备，网络，运营等等全部跑通，再进入现实建设。

除此之外，最值得关注的是“LPU”（Language Processing Unit）。LPU是语言处理器，是专门针对AI模型推理设计的算力芯片，原本是初创公司Groq研发的，跟GPU走了不同的路子，一度威胁到了英伟达的护城河。于是就被英伟达花200亿美元买了。

这次老黄也没藏着，直接宣布已经把LPU集成到了Vera Rubin平台，推出了NVIDIA Groq 3 LPX作为推理加速器。内存带宽足足 40 PB/s，是这次Rubin GPU机柜的25倍，推理速度直接起飞。

除了硬件，老黄也在搞龙虾。不过是更高规格的企业级代理平台，叫“NemoClaw”。它被称作是Linux一样的“新操作系统”，内置安全层，支持自主进化和全天候运行，并用NVIDIA Agent Toolkit加固了安全性。

另外值得关注的还有具身智能模型“Isaac GR00T N 系列”以及世界模型“Cosmos”。具身智能的模型好理解，其实就是机器人的大脑。而世界模型，是能够以高度真实的物理模拟合成虚拟的现实世界，用于训练机器人进行时空感知。这有可能是解决现实世界交互数据采集困难的一条出路。

总的来说，老黄还在带领英伟达朝着他理想中的AI时代大步迈进，而他背后这些密密麻麻的机构名称也提醒着我们，AI时代的下一幕可能不远了。

发布于浙江