程贵锋gui 26-01-07 15:01
微博认证:中国电信广州研究院 终端研发中心 副总经理 头条文章作者

黄仁勋在 NVIDIA CES 2026 主题演讲中围绕 AI 与加速计算的工业革命展开
核心观点如下:
一、行业变革:双重平台转移与计算重塑
计算机行业正经历双重平台转移:一是应用程序全面构建于 AI 之上,二是软件研发与运行方式根本性变革(从编写软件转向训练软件,从 CPU 运行转向 GPU 加速)。
计算行业的五层架构(硬件基础、芯片、基础设施、模型、应用)均在重构,全球约 10 万亿美元计算基础设施向新计算方式现代化,数千亿美元风投及海量产业研发预算涌入 AI 领域。
二、AI 技术突破与发展趋势
技术演进脉络:从 2015 年 BERT、2017 年 Transformer,到 2022 年 ChatGPT 唤醒行业,再到测试时缩放(实时 “思考”)、强化学习后训练等技术推动,AI 能力持续升级。
关键技术方向:
代理系统(Agentic Systems):具备推理、查资料、用工具、规划等能力,已普及并重塑软件编程等场景;
物理 AI(Physical AI)与 AI 物理学:前者实现 AI 与物理世界互动,后者让 AI 理解物理定律,需依赖模拟系统和合成数据训练;
开放模型:以 DeepSeek R1 为代表,开放创新激活全球参与,虽落后前沿模型 6 个月,但迭代速度快、下载量激增,重塑 AI 行业格局。
三、AI 应用架构与生态合作
现代 AI 应用核心架构:以多模型(Multi-model)、多模态(理解语音、图像等)、多云 / 混合云为特征,通过智能路由器匹配适配模型,结合定制化与前沿模型,接入工具、文件及其他代理。
生态合作广泛:与 Palantir、ServiceNow、Snowflake 等企业平台合作,将代理系统作为用户界面,革新企业 AI 交互方式(替代传统 Excel、命令行)。
四、物理 AI 的落地与突破
技术基础:依赖三台核心计算机(训练用、推理用、模拟用),以 Omniverse(数字孪生模拟)、Cosmos(世界基础模型)、Groot/Alpamayo(机器人 / 自动驾驶模型)为核心堆栈。
自动驾驶里程碑:发布开源的 Alpamayo 自动驾驶 AI,端到端训练,具备推理决策能力,可分解长尾场景,搭载双 Orin/Thor 芯片,采用双堆栈(Alpamayo + 经典 AV 堆栈)保障安全,将于 2026 年分阶段在美、欧、亚上市。
跨领域应用:技术可迁移至各类机器人(工业、服务、人形等),并与 Siemens、Cadence、Synopsys 等合作,革新工业设计、制造、运营全生命周期。
五、算力升级:Vera Rubin 超级计算机
研发背景:应对 AI 计算量飙升(模型规模年增 10 倍、Token 生成量年增 5 倍),通过极致协同设计突破性能瓶颈。
核心优势:
架构创新:由 Vera CPU、Rubin GPU 等六款定制芯片组成,17000 个组件集成,提供 100 Petaflops AI 算力(为前代 5 倍);
技术突破:NVFP4 Tensor Core 动态调整精度,ConnectX-9 网卡、BlueField-4 DPU 优化数据传输与安全,Spectrum-X 以太网交换机实现超高速互联;
高效节能:45℃热水冷却,无需冷水机组,节省数据中心电力,支持机密计算(传输、存储、计算全加密),具备功率平滑技术避免能源浪费;
性能表现:训练 10 万亿参数模型仅需前代 1/4 系统,工厂吞吐量较 Blackwell 再提 10 倍,Token 生成成本大幅降低。
六、NVIDIA 的全栈定位与愿景
定位:从芯片制造商升级为全栈 AI 解决方案提供商,开源模型、数据、工具库(NeMo 等),赋能全球企业、行业、国家参与 AI 革命。
愿景:推动自动驾驶大规模普及,让各类机器人走进生活,通过 AI 与加速计算引领工业革命,最终实现 AI 无处不在的智能世界。
http://t.cn/AXbKlERI

发布于 广东