#英伟达的AI工厂# 英伟达召开了一年一度的GTC (GPU技术大会),老黄根本不担心自家的显卡没人用,所以没有太多的弯弯绕绕,只有肌肉感爆棚的性能数据。AI仍然是这次大会的核心,而英伟达想成为一个贯穿AI行业的基建——“AI工厂 ”。
首先是游戏相关的DLSS 5,引入了“实时神经渲染”,直接把AI接入渲染流程中。得到的效果就是让游戏视觉逼近了电影级的真实感,同时还能保持较高的帧率运行。算力需求也是蹭蹭涨, DLSS 5的秋季首发只在50系显卡上。但由于演示图对比过大,也是引发了不少担忧,怕破坏掉原来的美术风格。
好了就介绍了2分钟游戏,后面全是AI。先是Vera Rubin新平台,作为继Blackwell后的新一代架构,这是未来几年英伟达AI算力的核心王牌。在主力Vera Rubin NVL72机柜中,单机架能塞进72颗Rubin GPU + 36颗Vera CPU,训练MoE模型只需上一代Blackwell的1/4 GPU算力,效率飞升,而且已经量产,预计是下半年出货。
老黄更想卖的其实是整合了算力产业的捆绑包,里面除了GPU,还有英伟达自家的CPU,用于信号传输的NVLink 72,以及液冷机架,存储系统,网络系统,安全管控,机架级集成等配套设施。他甚至怕你买了不会使,搞了个虚拟AI工厂,让你先把设备,网络,运营等等全部跑通,再进入现实建设。
除此之外,最值得关注的是“LPU”(Language Processing Unit)。LPU是语言处理器,是专门针对AI模型推理设计的算力芯片,原本是初创公司Groq研发的,跟GPU走了不同的路子,一度威胁到了英伟达的护城河。于是就被英伟达花200亿美元买了。
这次老黄也没藏着,直接宣布已经把LPU集成到了Vera Rubin平台,推出了NVIDIA Groq 3 LPX作为推理加速器。内存带宽足足 40 PB/s,是这次Rubin GPU机柜的25倍,推理速度直接起飞。
除了硬件,老黄也在搞龙虾。不过是更高规格的企业级代理平台,叫“NemoClaw”。 它被称作是Linux一样的“新操作系统”,内置安全层,支持自主进化和全天候运行,并用NVIDIA Agent Toolkit加固了安全性。
另外值得关注的还有具身智能模型“Isaac GR00T N 系列”以及世界模型“Cosmos”。具身智能的模型好理解,其实就是机器人的大脑。而世界模型,是能够以高度真实的物理模拟合成虚拟的现实世界,用于训练机器人进行时空感知。这有可能是解决现实世界交互数据采集困难的一条出路。
总的来说,老黄还在带领英伟达朝着他理想中的AI时代大步迈进,而他背后这些密密麻麻的机构名称也提醒着我们,AI时代的下一幕可能不远了。
