黄仁勋GTC 2026主题演讲总结文档
会议时间:2026年3月17日(北京时间)
演讲主题:AI工业化新十年——从算力芯片到AI工厂、智能体与物理AI全栈落地
核心定位:英伟达从GPU厂商转向AI全栈基础设施服务商,宣告AI进入工业化、推理优先、物理落地新阶段。
一、核心芯片与算力架构(三大算力支柱)
1. Vera Rubin(2026量产主力)
• 工艺:台积电3nm EUV,HBM4(288GB,带宽为HBM3e×2.75)
• 性能:推理≈H100×5、训练≈H100×3.5,单Token成本降10倍
• 部署:800V HVDC供电,单机柜240–260kW,全液冷标配
• 客户:OpenAI、DeepMind已锁定订单
2. Feynman(下一代前瞻架构,2028年)
• 工艺:台积电A16 1.6nm,GAA全环绕栅极+背面供电
• 技术:硅光子光互连,带宽密度×10、能耗降90%
• 定位:全球首款面向世界模型/物理AI设计的GPU架构
3. LPU推理专用芯片(LPX机架)
• 设计:纯SRAM存算一体(230MB片上SRAM),无HBM/DRAM
• 性能:带宽80TB/s,首Token延迟<0.1秒,推理≈H100×10
• 部署:单机柜可扩至256颗,OpenAI为首批大客户
二、AI基础设施与互联革命
1. 光进铜退:CPO光互联商用
• Quantum X3450/Spectrum-X交换机,MicroLED CPO能耗仅铜缆5%
• 突破电互联物理极限,支撑超大规模AI集群低时延、高能效
2. 供电与散热革新
• 800V高压直流+模块化垂直供电,适配超高功耗算力节点
• Rubin全系液冷,采用液态金属/金刚石散热,保障高密度部署
3. AI工厂全栈方案
• 覆盖算力部署、数据流转、模型训练、推理调度、应用协同
• 推动AI从实验室研发走向工业化规模化落地
三、软件生态与AI应用
1. AI智能体:NeMoClaw开源平台
• 企业级开箱即用,支持本地部署、隐私优先
• 支撑多模态交互、自主任务执行、跨设备协同
2. 开发框架升级
• CUDA 14、NeMo 6.0发布,优化分布式训练与多模态推理
• 面向MoE模型、物理AI、智能体场景深度适配
3. 物理AI与行业落地
• 物理AI:让AI理解物理规则,赋能机器人、工业自动化、数字孪生
• 自动驾驶:AlphaMale端到端可解释AI,支持L4+量产
• 图形技术:DLSS 5发布,图形渲染进入“GPT时刻”
四、核心战略与关键论断
1. Token是AI时代基石,英伟达致力于成为全球每Token成本最低的算力提供商
2. AI从训练为王转向推理优先,智能体与实时交互成为核心场景
3. 从云端AI走向物理AI/具身智能,AI全面进入现实世界
4. 后摩尔时代,光互联+先进封装+液冷是算力突破的核心路径
五、总结与行业影响
本次演讲确立英伟达在AI工业化时代的全栈主导地位:以Rubin/LPU支撑当下规模化推理,以Feynman布局未来物理AI,以光互联与AI工厂重构基础设施,以NeMoClaw推动智能体普及。算力、能效、成本三重突破,加速AI从模型创新走向产业普惠。
发布于 北京
