源深路炒家 26-04-22 20:26
微博认证:投资内容创作者 AI博主

Google在算力侧也开始明显发力,对标的不只是模型,而是整个AI成本结构。
这次发布的新一代TPU分成两类:TPU 8t(训练)和TPU 8i(推理)。逻辑很清晰,训练和推理开始彻底分化,尤其推理侧已经成为竞争核心。
几个关键信号:
1)核心目标是“降本+降延迟”。Google明确提出要把“单次推理成本”持续压低,同时降低响应延迟,本质是在解决AI大规模商业化的两大瓶颈。
2)推理芯片重要性大幅提升。TPU 8i强调更大本地存储,把数据尽量留在芯片内,减少外部调用,这对于多步推理(reasoning)场景非常关键。
3)能效成为硬约束。TPU 8t性能/功耗提升124%,8i提升117%,同时支持9600颗芯片级别的集群部署,说明数据中心已经从“算力瓶颈”转向“电力瓶颈”。
4)自研芯片+生态双线推进。Google一方面强化TPU体系,另一方面仍然继续支持Nvidia,并计划第一批部署新一代Nvidia架构,策略是“自研替代+兼容市场标准”并行。
5)行业趋势一致:推理爆发。Nvidia也在强化推理(甚至收购Groq相关技术),并判断超过20%的AI workload更适合专用推理芯片。
整体来看,AI竞争已经从“谁模型更强”转向“谁单位成本更低”。训练决定上限,但推理决定商业化规模,而真正的护城河开始下沉到算力效率和系统工程能力。#谷歌##人工智能# http://t.cn/A6D9gdpz

发布于 上海