谷歌云发布新一代TPU芯片

【聚焦谷歌云年度大会，如何影响市场风向？】
谷歌云发布全新TPU芯片系列

美东时间4月22日，据彭博报道，谷歌母公司 Alphabet 旗下谷歌云部门推出了新一代张量处理单元（TPU），这是一款自研芯片，旨在让人工智能计算服务更快、更高效。

谷歌周三在谷歌云 Next 大会上宣布，新款芯片将推出两个版本：TPU 8t 专为人工智能软件开发（训练）打造，TPU 8i 则用于 AI 模型开发完成后的运行服务，也就是推理阶段。

在英伟达主导的 AI 芯片行业中，谷歌已成为最成功的自研 AI 芯片厂商之一。近几个月来，TPU 在硅谷成为抢手产品，谷歌希望借助最新版本延续这一势头。

这一举措是谷歌更广泛战略的一部分，目标是降低 AI 软件部署成本、减少能耗，并提升服务响应速度。新一代 TPU 在芯片上集成了更大容量的存储，可实现用户期待的快速响应。不过，日益复杂的软件架构对算力的需求也在持续攀升。

谷歌计算与 AI 基础设施副总裁马克・洛迈尔表示：“核心在于如何以尽可能低的单次交易成本，实现尽可能低的响应延迟。交易数量正在大幅增长，要实现规模化，单次交易成本就必须大幅下降。”

AI 服务与软件的开发，需要系统快速处理海量数据，建立可被数学化表达的关联与模式，这一过程为训练。而推理阶段 —— 即运行软件与服务 —— 则高度依赖集成了超大内存的处理器。

这种设计让 AI 响应更即时，处理器无需再调取外部存储的数据，在计算机进行多步骤推理、自主学习的场景中尤为实用。

训练芯片 TPU 8t 可集群扩展至 9600 颗规模。谷歌表示，部署这类超大规模系统时，电力已成为数据中心的主要制约因素，因此需要更高能效的系统，在有限电力下实现最优性能。TPU 8t 的每瓦性能较上一代提升 124%，TPU 8i 提升 117%。

性能提升也得益于谷歌自研网络技术的改进，提升了芯片间高效通信的能力。谷歌称，基于该芯片的 AI 系统将于今年晚些时候全面上市。

谷歌同时表示，将继续为使用当前主流 AI 计算系统的客户提供基于英伟达芯片的服务。洛迈尔称，谷歌计划成为今年下半年首批部署英伟达新一代架构产品的厂商之一。

与谷歌一样，英伟达也正加大对 AI 推理环节的投入。其即将推出的芯片系列将整合收购 Groq 所得的技术，该技术专为实现超快响应速度而设计。英伟达 CEO 黄仁勋表示，超过 20% 的 AI 工作负载最适合使用这类芯片。Groq 于 2016 年由一批前谷歌工程师创立。去年 12 月，英伟达以 200 亿美元获得该技术授权，并聘用了其大部分工程团队。

发布于上海