今晚(凌晨02:00),黄仁勋将发表主题演讲,其中一个关注点是英伟达下一代芯片—Feynman,将侧重推理,并转向LPU架构。
传统的GPU架构虽然在模型训练的海量数据思考中表现出色,但在快速回应的推理环节表现不足,为了解决这一痛点,一种全新的芯片架构—LPU(语言处理单元,Language Processing Unit) 应运而生,LPU是专为自然语言处理和大模型推理阶段设计的ASIC专用芯片。
LPU有两个核心特点,一是摒弃了传统的HBM,转而采用大容量的片上静态随机存取存储器SRAM作为主要存储介质,以Groq公司的LPU为例,每颗芯片内置约230MB的SRAM,总带宽高达惊人的80TB/s。二是张量流处理器TSP架构,取得极致的低延迟和高度稳定的时延表现,对于自动驾驶、实时语音交互等对响应时间极其敏感的应用场景至关重要。
Feynman是英伟达计划在2028年推出的下一代GPU架构,将接替Rubin架构,采用台积电最先进的A16制程,并首发多项前沿技术,其中最具革命性的变革,是它对LPU的深度整合。根据行业报告和爆料,英伟达已斥巨资获得Groq公司的LPU技术授权,并计划在Feynman架构中,通过3D堆叠技术将LPU单元直接融入GPU。
发布于 安徽
