高盛分析GPU与ASIC竞争

高盛这篇关于 GPU vs ASIC（TPU / Trainium）的报告，核心不是“谁会取代谁”，而是用一条“推理成本曲线”把 AI 算力竞争真正量化了。

结论很清晰：
Google + Broadcom 的 TPU，正在快速追平 Nvidia GPU 的推理成本；但 Nvidia 依然掌握节奏、生态和时间窗口。

从结果看，高盛测算显示，TPU v6 → v7 单代推理成本下降约 70%，在“每百万 tokens 成本”上，已经做到与 Nvidia GB200 NVL72 持平，甚至略低；而 AMD 和 AWS Trainium，目前单代成本下降幅度大约只有 30%，在绝对成本上仍明显落后。这也解释了为什么 Google 内部（包括 Gemini）和 Anthropic 这类软件能力极强的客户，会快速转向 TPU。

但这并不意味着 Nvidia 被“击败”。报告反复强调，Nvidia 的核心优势并不只是算力成本，而是三点叠加：
1）最快的产品节奏（几乎一年一代，GB300 已发、VR200 预计 2H26）；
2）CUDA 生态的迁移壁垒，尤其对企业客户极其关键；
3）从芯片到整机、再到网络的全栈整合能力。

真正的结构性变化在于：算力本身已接近光罩极限，下一轮成本下降不再主要来自“芯片更强”，而是来自网络、存储和封装。
包括：以太网 scale-up/scale-out、HBM 与 NAND 的深度整合、CoWoS 多 die 封装、机柜级算力密度提升，以及 CPO（共封装光学）。这也是高盛明确“同时看多 Nvidia 和 Broadcom”的根本原因。

报告还点出了一个容易被忽视的现实：
AI 推理成本必须持续大幅下降，否则整个 AI 商业化是站不住的。
正因为 TPU 这类 ASIC 在推理端已经逼近 GPU 成本，而 Nvidia 毛利仍明显领先，叠加云厂商 CapEx 高企但 LLM 盈利尚未清晰，市场才会持续质疑 Nvidia 的“护城河可持续性”，这也是 NVDA 估值相对 AI 芯片同行仍有折价的重要背景。

高盛给出的长期判断并不极端：
未来无论 AI 渗透慢还是快，ASIC 的份额都会提升；但在“AI 应用全面爆发”的最乐观情景下，Nvidia 反而是最大受益者，因为训练需求、模型复杂度和技术迭代速度，都会强化其 time-to-market 和生态优势。

一句话总结这篇报告：
这不是一场“GPU 会不会被 ASIC 干掉”的故事，而是一场围绕推理成本、系统工程和商业化落地速度的长期博弈。#人工智能[超话]##美股[超话]#

发布于上海