源深路炒家
26-01-20 20:41 微博认证:投资内容创作者 AI博主

高盛这篇关于 GPU vs ASIC(TPU / Trainium) 的报告,核心不是“谁会取代谁”,而是用一条“推理成本曲线”把 AI 算力竞争真正量化了。

结论很清晰:
Google + Broadcom 的 TPU,正在快速追平 Nvidia GPU 的推理成本;但 Nvidia 依然掌握节奏、生态和时间窗口。

从结果看,高盛测算显示,TPU v6 → v7 单代推理成本下降约 70%,在“每百万 tokens 成本”上,已经做到与 Nvidia GB200 NVL72 持平,甚至略低;而 AMD 和 AWS Trainium,目前单代成本下降幅度大约只有 30%,在绝对成本上仍明显落后。这也解释了为什么 Google 内部(包括 Gemini)和 Anthropic 这类软件能力极强的客户,会快速转向 TPU。

但这并不意味着 Nvidia 被“击败”。报告反复强调,Nvidia 的核心优势并不只是算力成本,而是三点叠加:
1)最快的产品节奏(几乎一年一代,GB300 已发、VR200 预计 2H26);
2)CUDA 生态的迁移壁垒,尤其对企业客户极其关键;
3)从芯片到整机、再到网络的全栈整合能力。

真正的结构性变化在于:算力本身已接近光罩极限,下一轮成本下降不再主要来自“芯片更强”,而是来自网络、存储和封装。
包括:以太网 scale-up/scale-out、HBM 与 NAND 的深度整合、CoWoS 多 die 封装、机柜级算力密度提升,以及 CPO(共封装光学)。这也是高盛明确“同时看多 Nvidia 和 Broadcom”的根本原因。

报告还点出了一个容易被忽视的现实:
AI 推理成本必须持续大幅下降,否则整个 AI 商业化是站不住的。
正因为 TPU 这类 ASIC 在推理端已经逼近 GPU 成本,而 Nvidia 毛利仍明显领先,叠加云厂商 CapEx 高企但 LLM 盈利尚未清晰,市场才会持续质疑 Nvidia 的“护城河可持续性”,这也是 NVDA 估值相对 AI 芯片同行仍有折价的重要背景。

高盛给出的长期判断并不极端:
未来无论 AI 渗透慢还是快,ASIC 的份额都会提升;但在“AI 应用全面爆发”的最乐观情景下,Nvidia 反而是最大受益者,因为训练需求、模型复杂度和技术迭代速度,都会强化其 time-to-market 和生态优势。

一句话总结这篇报告:
这不是一场“GPU 会不会被 ASIC 干掉”的故事,而是一场围绕推理成本、系统工程和商业化落地速度的长期博弈。#人工智能[超话]##美股[超话]#

发布于 上海