5月18日,NVIDIA正式开始交付其首款自研CPU——Vera,标志着这家GPU巨头正式进入CPU市场。NVIDIA超大规模与高性能计算副总裁Ian Buck亲自将首批Vera CPU送达四家客户:Anthropic(旧金山)、OpenAI(Mission Bay)、SpaceXAI(Palo Alto)和Oracle Cloud Infrastructure(圣克拉拉)。
Vera与传统服务器CPU的根本差异在于其专为AI Agent工作负载优化的设计理念。Jensen Huang在今年GTC大会上曾指出,Agent工作负载代表"根本不同的计算模式"——Agent更多时间用于推理、检索上下文和执行工具调用,而非暴力矩阵运算。Vera的架构因此强调内存带宽和低延迟互连,而非单纯追求核心数量。
这直接挑战了Intel Xeon和AMD EPYC在数据中心CPU市场的长期统治地位。更具战略意义的是,NVIDIA可能将Vera与下一代Blackwell GPU捆绑销售,提供从CPU到GPU的完全垂直整合解决方案——一个供应商覆盖整个AI堆栈。Oracle的早期获取也表明云服务商正在争夺"Agent即服务"市场的差异化优势。
简评:Vera的交付是NVIDIA从"AI训练的王者"向"AI全栈基础设施垄断者"演进的关键一步。当CPU+GPU+网络(Spectrum-X/ConnectX)全部来自一个供应商时,整个行业的供应链权力将进一步集中。Intel和AMD现在面临的不仅是GPU竞争的失利,更是CPU这个"最后堡垒"被侵蚀的现实威胁。首批客户选择了Agent方向最激进的三家AI实验室+一家意图弯道超车的云商,信号极为明确。
发布于 北京
