AI 是“五层蛋糕”基础设施
时间:2026 年 3 月 10 日
作者:黄仁勋(Jensen Huang)
人工智能(AI)是当今塑造世界的最强大力量之一。
它不仅是一个聪明的应用程序或单一的模型;它是如同电力和互联网一样不可或缺的基础设施。
AI 运行在真实的硬件、真实的能源和真实的经济基础之上。它获取原材料,并将其大规模地转化为智能。每一家公司都将使用它,每一个国家都将建设它。
为了理解为什么 AI 会以这种方式发展,我们需要从第一性原理出发进行推演,并审视计算领域究竟发生了哪些根本性的变化。
从预录制软件到实时智能
在计算技术发展的大部分历史中,软件都是“预录制”的。
人类编写算法,计算机负责执行。数据必须经过精心的结构化处理,存储在表格中,并通过精确的查询语句进行检索。SQL 之所以变得不可或缺,正是因为它让那个世界得以正常运转。
然而,AI 打破了这种模式。
这是我们有史以来第一次,计算机能够理解非结构化的信息。它能够看懂图像、阅读文本、听懂声音并理解其中的含义。它能够对上下文和意图进行推理。最重要的是,它能够实时生成智能。
每一次响应都是全新创造的。每一个答案都取决于你所提供的上下文。这不再是检索预存指令的软件,而是能够根据需求进行推理并生成智能的软件。
正因为智能是实时生成的,支撑它的整个底层计算技术栈都必须被重新发明。
作为基础设施的 AI
当你从工业的角度审视 AI 时,它可以被拆解为一个五层的技术栈。
1. 能源
最基础的一层是能源。
实时生成的智能需要实时产生的电力。每一个生成的 token(标记),都是电子移动、热量管理以及能源转化为计算力的结果。
在这一层之下,没有任何抽象层。能源是 AI 基础设施的第一性原理,也是决定系统能产生多少智能的硬性约束条件。
2. 芯片
在能源之上是芯片。
这些处理器旨在将能源大规模且高效地转化为计算力。AI 工作负载需要庞大的并行计算能力、高带宽内存以及快速的互连技术。
芯片层的进步,决定了 AI 扩展的速度,以及智能变得可负担的程度。
3. 基础设施
在芯片之上是基础设施。
这包括土地、电力输送、冷却系统、建筑施工、网络,以及将成千上万个处理器协同运作组成一台机器的系统。
这些系统就是“AI 工厂”。它们的设计初衷不是为了存储信息,而是为了制造智能。
4. 模型
在基础设施之上是模型。
AI 模型能够理解多种类型的信息:语言、生物学、化学、物理学、金融、医学以及物理世界本身。语言模型仅仅是其中的一个类别。
目前一些最具颠覆性的工作正发生在蛋白质 AI、化学 AI、物理模拟、机器人技术以及自主系统领域。
5. 应用
最顶层是应用,这也是创造经济价值的地方。
药物发现平台、工业机器人、法律助手、自动驾驶汽车均属此类。自动驾驶汽车是具身于机器中的 AI 应用;人形机器人则是具身于躯体中的 AI 应用。
它们使用的是同一个技术栈,却带来了不同的成果。
AI 的“五层蛋糕”
能源 → 芯片 → 基础设施 → 模型 → 应用
每一个成功的应用都在强有力地拉动它底部的每一层,一直延伸到维持其运转的发电厂。
我们才刚刚开始这一建设进程。
目前我们已经投入了数千亿美元,但仍有数万亿美元的基础设施等待建设。放眼全球,我们看到芯片工厂、计算机组装厂和 AI 工厂正在以史无前例的规模拔地而起。
这正在成为人类历史上规模最大的一场基础设施建设。
AI 基础设施建设也在创造就业
支撑这一建设所需的劳动力是极其庞大的。
AI 工厂需要电工、水管工、管道装配工、钢铁工人、网络技术人员、安装工以及操作员。这些都是高技能、高薪酬的岗位,且目前供不应求。
你不需要拥有计算机科学博士学位,也能参与到这场变革之中。
与此同时,AI 正在推动整个知识经济的生产力提升。
以放射学为例,现在 AI 已经可以辅助读取扫描影像,但对放射科医生的需求却仍在持续增长。
这并不是一个悖论。放射科医生的核心职责是关怀患者,而读取影像只是这过程中的一项任务。当 AI 承担了更多日常的重复性工作时,放射科医生就可以将精力集中在诊断判断、沟通交流和患者护理上。
这样一来,医院的效率提高了,能够服务更多的患者,进而也会雇佣更多的员工。
生产力创造了容量,容量带来了增长。
过去一年发生了什么改变?
在过去的一年里,AI 跨过了一个重要的分水岭。
模型变得足够优秀,能够在宏观规模上发挥实用价值。推理能力提升了,幻觉减少了,事实依据的准确性(Grounding)有了显著提高。
这是有史以来第一次,基于 AI 构建的应用开始产生真正的经济价值。
在药物发现、物流、客户服务、软件开发以及制造业等领域的应用,已经展现出了极强的产品市场契合度。这些应用有力地拉动着它们底下的每一个技术层。
在这里,开源模型发挥着至关重要的作用。
世界上大部分的模型都是免费的。研究人员、初创公司、大型企业乃至整个国家,都依赖开源模型来参与到先进的 AI 浪潮中。
当开源模型达到最前沿水平时,它们改变的不仅仅是软件,它们更是激活了跨越整个技术栈的需求。
DeepSeek-R1 就是一个强有力的例子。通过让一个强大的推理模型被广泛使用,它加速了应用层的落地,同时也增加了对其底层的训练、基础设施、芯片和能源的需求。
这意味着什么
当你将 AI 视为不可或缺的基础设施时,其深远的影响便清晰可见。
AI 始于 Transformer 架构的大语言模型。但它远不止于此。这是一场工业变革,它重塑了能源的生产与消耗方式、工厂的建造方式、工作的组织方式,以及经济的增长方式。
之所以要建设 AI 工厂,是因为现在智能是实时生成的;
之所以要重新设计芯片,是因为效率决定了智能扩展的速度;
能源之所以成为核心,是因为它设定了智能产能的绝对上限;
应用之所以在加速落地,是因为它们底层的模型已经跨过了分水岭,最终能够在大规模场景中发挥实用价值。
每一个层级都在与其他层级相互促进。
这就是为什么这场基础设施建设的规模如此宏大。
这就是为什么它能同时触及如此多的行业。
这也是为什么它不会局限于单一的国家或单一的领域。
每一家公司都将使用 AI,每一个国家都将建设它。
我们仍处于早期阶段。大部分的基础设施尚未建成,大部分的劳动力尚未得到培训,大部分的机会尚未被发掘。
但是,方向已经十分明确。
AI 正在成为现代世界的底层基础设施。
而我们现在所做出的选择——我们建设的速度有多快,我们参与的范围有多广,我们部署 AI 的态度有多负责任——将最终塑造这个时代未来的模样。
英文原文:
NVIDIA Blog, AI Is a 5-Layer Cake
http://t.cn/AXVp5ysZ
发布于 上海
