Google发布新一代TPU

Google在算力侧也开始明显发力，对标的不只是模型，而是整个AI成本结构。
这次发布的新一代TPU分成两类：TPU 8t（训练）和TPU 8i（推理）。逻辑很清晰，训练和推理开始彻底分化，尤其推理侧已经成为竞争核心。
几个关键信号：
1）核心目标是“降本+降延迟”。Google明确提出要把“单次推理成本”持续压低，同时降低响应延迟，本质是在解决AI大规模商业化的两大瓶颈。
2）推理芯片重要性大幅提升。TPU 8i强调更大本地存储，把数据尽量留在芯片内，减少外部调用，这对于多步推理（reasoning）场景非常关键。
3）能效成为硬约束。TPU 8t性能/功耗提升124%，8i提升117%，同时支持9600颗芯片级别的集群部署，说明数据中心已经从“算力瓶颈”转向“电力瓶颈”。
4）自研芯片+生态双线推进。Google一方面强化TPU体系，另一方面仍然继续支持Nvidia，并计划第一批部署新一代Nvidia架构，策略是“自研替代+兼容市场标准”并行。
5）行业趋势一致：推理爆发。Nvidia也在强化推理（甚至收购Groq相关技术），并判断超过20%的AI workload更适合专用推理芯片。
整体来看，AI竞争已经从“谁模型更强”转向“谁单位成本更低”。训练决定上限，但推理决定商业化规模，而真正的护城河开始下沉到算力效率和系统工程能力。#谷歌##人工智能# http://t.cn/A6D9gdpz

发布于上海