NVIDIA Groq 3 LPU 的量产订单意义 [吃瓜]
Groq 3 LPU 搭载 500MB 的 SRAM,频宽高达 150TB/s。
这带来了在顶级推理运算中,相较于 Blackwell 高达 35 倍 的效能提升。由于在大规模 AI 模型中,资料移动成本已日益超过运算成本,因此晶片上 SRAM 的资料重用重要性正快速扩大。
AWS 上周也传出计画采用 Cerebras 的 WSE-3(44GB SRAM),原因类似。然而,SRAM 由六个电晶体单元组成,相较于 DRAM(1T+1Cap 结构)需要超过 10 倍 的面积。其复杂结构与敏感的操作特性,使得透过制程微缩所实现的面积缩减幅度,比逻辑元件更为有限。
未来,推理系列机器对 SRAM 的扩大使用,预计将需要更多先进晶圆厂的产能。这项订单验证了该公司在资料中心加速器(包括晶片上 SRAM)的量产能力。该公司几乎是唯一能够涵盖从 SRAM 到 SSD 完整记忆体阶层的全端制造商。
发布于 北京
