师晨冰 26-03-17 18:16
微博认证: 黄金投资分析师资格证持有者

黄仁勋GTC 2026主题演讲总结文档

会议时间:2026年3月17日(北京时间)
演讲主题:AI工业化新十年——从算力芯片到AI工厂、智能体与物理AI全栈落地
核心定位:英伟达从GPU厂商转向AI全栈基础设施服务商,宣告AI进入工业化、推理优先、物理落地新阶段。

一、核心芯片与算力架构(三大算力支柱)

1. Vera Rubin(2026量产主力)

• 工艺:台积电3nm EUV,HBM4(288GB,带宽为HBM3e×2.75)

• 性能:推理≈H100×5、训练≈H100×3.5,单Token成本降10倍

• 部署:800V HVDC供电,单机柜240–260kW,全液冷标配

• 客户:OpenAI、DeepMind已锁定订单

2. Feynman(下一代前瞻架构,2028年)

• 工艺:台积电A16 1.6nm,GAA全环绕栅极+背面供电

• 技术:硅光子光互连,带宽密度×10、能耗降90%

• 定位:全球首款面向世界模型/物理AI设计的GPU架构

3. LPU推理专用芯片(LPX机架)

• 设计:纯SRAM存算一体(230MB片上SRAM),无HBM/DRAM

• 性能:带宽80TB/s,首Token延迟<0.1秒,推理≈H100×10

• 部署:单机柜可扩至256颗,OpenAI为首批大客户
二、AI基础设施与互联革命

1. 光进铜退:CPO光互联商用

• Quantum X3450/Spectrum-X交换机,MicroLED CPO能耗仅铜缆5%

• 突破电互联物理极限,支撑超大规模AI集群低时延、高能效

2. 供电与散热革新

• 800V高压直流+模块化垂直供电,适配超高功耗算力节点

• Rubin全系液冷,采用液态金属/金刚石散热,保障高密度部署

3. AI工厂全栈方案

• 覆盖算力部署、数据流转、模型训练、推理调度、应用协同

• 推动AI从实验室研发走向工业化规模化落地
三、软件生态与AI应用

1. AI智能体:NeMoClaw开源平台

• 企业级开箱即用,支持本地部署、隐私优先

• 支撑多模态交互、自主任务执行、跨设备协同

2. 开发框架升级

• CUDA 14、NeMo 6.0发布,优化分布式训练与多模态推理

• 面向MoE模型、物理AI、智能体场景深度适配

3. 物理AI与行业落地

• 物理AI:让AI理解物理规则,赋能机器人、工业自动化、数字孪生

• 自动驾驶:AlphaMale端到端可解释AI,支持L4+量产

• 图形技术:DLSS 5发布,图形渲染进入“GPT时刻”
四、核心战略与关键论断

1. Token是AI时代基石,英伟达致力于成为全球每Token成本最低的算力提供商

2. AI从训练为王转向推理优先,智能体与实时交互成为核心场景

3. 从云端AI走向物理AI/具身智能,AI全面进入现实世界

4. 后摩尔时代,光互联+先进封装+液冷是算力突破的核心路径
五、总结与行业影响

本次演讲确立英伟达在AI工业化时代的全栈主导地位:以Rubin/LPU支撑当下规模化推理,以Feynman布局未来物理AI,以光互联与AI工厂重构基础设施,以NeMoClaw推动智能体普及。算力、能效、成本三重突破,加速AI从模型创新走向产业普惠。

发布于 北京