黄仁勋GTC 2026演讲总结

黄仁勋GTC 2026主题演讲总结文档

会议时间：2026年3月17日（北京时间）
演讲主题：AI工业化新十年——从算力芯片到AI工厂、智能体与物理AI全栈落地
核心定位：英伟达从GPU厂商转向AI全栈基础设施服务商，宣告AI进入工业化、推理优先、物理落地新阶段。

一、核心芯片与算力架构（三大算力支柱）

1. Vera Rubin（2026量产主力）

• 工艺：台积电3nm EUV，HBM4（288GB，带宽为HBM3e×2.75）

• 性能：推理≈H100×5、训练≈H100×3.5，单Token成本降10倍

• 部署：800V HVDC供电，单机柜240–260kW，全液冷标配

• 客户：OpenAI、DeepMind已锁定订单

2. Feynman（下一代前瞻架构，2028年）

• 工艺：台积电A16 1.6nm，GAA全环绕栅极+背面供电

• 技术：硅光子光互连，带宽密度×10、能耗降90%

• 定位：全球首款面向世界模型/物理AI设计的GPU架构

3. LPU推理专用芯片（LPX机架）

• 设计：纯SRAM存算一体（230MB片上SRAM），无HBM/DRAM

• 性能：带宽80TB/s，首Token延迟<0.1秒，推理≈H100×10

• 部署：单机柜可扩至256颗，OpenAI为首批大客户
二、AI基础设施与互联革命

1. 光进铜退：CPO光互联商用

• Quantum X3450/Spectrum-X交换机，MicroLED CPO能耗仅铜缆5%

• 突破电互联物理极限，支撑超大规模AI集群低时延、高能效

2. 供电与散热革新

• 800V高压直流+模块化垂直供电，适配超高功耗算力节点

• Rubin全系液冷，采用液态金属/金刚石散热，保障高密度部署

3. AI工厂全栈方案

• 覆盖算力部署、数据流转、模型训练、推理调度、应用协同

• 推动AI从实验室研发走向工业化规模化落地
三、软件生态与AI应用

1. AI智能体：NeMoClaw开源平台

• 企业级开箱即用，支持本地部署、隐私优先

• 支撑多模态交互、自主任务执行、跨设备协同

2. 开发框架升级

• CUDA 14、NeMo 6.0发布，优化分布式训练与多模态推理

• 面向MoE模型、物理AI、智能体场景深度适配

3. 物理AI与行业落地

• 物理AI：让AI理解物理规则，赋能机器人、工业自动化、数字孪生

• 自动驾驶：AlphaMale端到端可解释AI，支持L4+量产

• 图形技术：DLSS 5发布，图形渲染进入“GPT时刻”
四、核心战略与关键论断

1. Token是AI时代基石，英伟达致力于成为全球每Token成本最低的算力提供商

2. AI从训练为王转向推理优先，智能体与实时交互成为核心场景

3. 从云端AI走向物理AI/具身智能，AI全面进入现实世界

4. 后摩尔时代，光互联+先进封装+液冷是算力突破的核心路径
五、总结与行业影响

本次演讲确立英伟达在AI工业化时代的全栈主导地位：以Rubin/LPU支撑当下规模化推理，以Feynman布局未来物理AI，以光互联与AI工厂重构基础设施，以NeMoClaw推动智能体普及。算力、能效、成本三重突破，加速AI从模型创新走向产业普惠。

发布于北京