碳基进化 26-03-17 07:38
微博认证:科技博主

黄仁勋在GTC 2026主题演讲中,用一整场演讲回答了一个核心命题:AI工厂如何把电力变成钱。

他的答案始于一个根本性的转变——数据中心不再是存放文件的仓库,而是生产token的工厂。这些工厂天生受困于电力,一旦建成,你的产能上限就被瓦数锁死。所以在电力围墙之内,唯一值得优化的事就是让每度电吐出更多token,因为token就是商品,算力就是营收,推理速度就是AI的智商标价。

他把这套逻辑画成一张坐标图:纵轴是每瓦产出多少token,横轴是推理速度。两者此消彼长——AI越聪明,思考越久,吞吐量就越低,但能卖的价钱越高。基于这个权衡,他勾勒出四层定价:免费层用高吞吐量换用户,中间层卖3到6美元每百万token,高阶层跳到45美元,顶级研究服务可达150美元。一个研究团队每天烧掉5000万token,按顶级价算也不过7500美元,"根本不算什么"。

这套分层定价直接决定了数据中心的营收公式。假设你手握1 GW电力,按25%配比切给四个层级,今年的配置明年就会精确兑现到账面上。这也是为什么架构升级如此值钱——Grace Blackwell让同一座工厂营收翻5倍,Vera Rubin再翻5倍,两年内token生成速率能从200万飙到7亿,膨胀350倍。黄仁勋算了一笔硬账:1GW工厂光建筑就摊掉400亿美元,"即使上面什么都不放,钱也已经花了",所以必须用最好的系统把token成本压到最低。

支撑这一切的是推理需求的百万倍爆发。生成式AI改写了计算范式,推理AI让token用量激增,Agent革命则让AI从回答问题变成执行任务——"100%的NVIDIA员工都在用Claude Code、Codex和Cursor的组合"。黄仁勋的结论是:AI每一次思考、阅读、做事、生成,都必须推理,需求早已碾压训练,"推理的拐点已经到来"。

整场演讲的潜台词很清楚:在电力受限的世界里,token经济学就是新的摩尔定律,而NVIDIA要做的就是让每一瓦电都变成可定价的智能。#微博新知#

发布于 江苏