黄仁勋将谈Feynman芯片

今晚（凌晨02:00），黄仁勋将发表主题演讲，其中一个关注点是英伟达下一代芯片—Feynman，将侧重推理，并转向LPU架构。

传统的GPU架构虽然在模型训练的海量数据思考中表现出色，但在快速回应的推理环节表现不足，为了解决这一痛点，一种全新的芯片架构—LPU（语言处理单元，Language Processing Unit）应运而生，LPU是专为自然语言处理和大模型推理阶段设计的ASIC专用芯片。

LPU有两个核心特点，一是摒弃了传统的HBM，转而采用大容量的片上静态随机存取存储器SRAM作为主要存储介质，以Groq公司的LPU为例，每颗芯片内置约230MB的SRAM，总带宽高达惊人的80TB/s。二是张量流处理器TSP架构，取得极致的低延迟和高度稳定的时延表现，对于自动驾驶、实时语音交互等对响应时间极其敏感的应用场景至关重要。

Feynman是英伟达计划在2028年推出的下一代GPU架构，将接替Rubin架构，采用台积电最先进的A16制程，并首发多项前沿技术，其中最具革命性的变革，是它对LPU的深度整合。根据行业报告和爆料，英伟达已斥巨资获得Groq公司的LPU技术授权，并计划在Feynman架构中，通过3D堆叠技术将LPU单元直接融入GPU。

发布于安徽