英伟达财报+GTC大会在即,LPU推理芯片成核心看点!产业链全梳理
英伟达于今日凌晨发布的四季度业绩与业绩指引均超出市场预期,财报显示其营收同比增长73%至681亿美元,高于市场预期的650亿美元。
另据Wccftech消息,英伟达年度重磅科技盛会GTC大会将于3月16日召开,作为AI行业的重要风向标,本次大会备受市场关注。
黄仁勋此前已表态,现有各类技术已逼近性能极限,本次GTC将推出多款全新芯片。
市场普遍预计,采用LPU架构的Feynman芯片有望正式发布,其配套方案将采用高多层PCB板。
此前,英伟达已与AI推理芯片先锋企业Groq达成约200亿美元的技术授权合作,获得LPU架构非独家IP授权,并整体引进其创始人及核心研发团队。
LPU将显著提升AI模型推理环节的算力效率,成为英伟达强化推理赛道、打开全新增量市场的关键布局。
本文重点围绕LPU推理芯片产业链核心环节展开梳理。
一、什么是LPU?
LPU(Language Processing Unit,语言处理单元)是专为大模型推理这类计算密集型任务设计的新型芯片架构,核心是通过架构创新,大幅优化语言模型推理效率。
LPU精简了传统GPU中大量冗余结构,只专注于AI推理环节(基于预训练模型处理输入并生成输出),可实现更低延迟、更高吞吐的推理性能,全面提升AI推理效率。
英伟达 × Groq 合作回顾
2025年12月,英伟达与AI芯片初创公司Groq达成非独家技术授权协议,斥资约200亿美元获取其LPU相关IP,并引进创始人Jonathan Ross、总裁Sunny Madra等核心团队,共同推进LPU技术迭代与产业化落地。
Groq正是LPU架构的开创者,其核心产品为专用推理ASIC芯片LPU,设计初衷并非追求极致算力规模,而是解决传统GPU长期存在的“延迟与吞吐难以兼顾”的痛点,主打确定性、低时延、高并发的交互式推理体验。
从技术上看,Groq第二代LPU采用三星SF4X 4nm工艺,能效比较初代14nm产品提升15–20倍,单集群可扩展至4128颗芯片全互联。
从产业定位看,Groq与英伟达并非竞争替代,而是高度互补:英伟达将把LPU的确定性执行、低延迟通信等优势特性融入Hopper/Blackwell架构,并计划将LPU硬件栈整合到新一代Feynman芯片中。
花旗分析师认为,LPU的引入将助力英伟达直接承接AI推理需求的爆发式增长。
LPU带来的行业影响
1. 显著提升AI推理性价比
Groq LPU在Meta Llama2-70B推理场景中,性能较英伟达H100提升约10倍,推理成本下降约80%,直接利好推理端及整体AI产业。
2. 推动PCB高端化、多层化升级
LPU架构对功耗、时延、高速互联要求极高,叠加CoWoS等先进封装,将推动PCB向超高多层、M9材料、背面供电等方向升级,主板有望采用52层M9+Q增强方案。
3. 提升PCB在AI服务器BOM中的价值占比
PCB在AI硬件物料成本中的占比,有望从当前3%–5%提升至未来5%–10%,行业价值量大幅抬升。
二、LPU 全产业链梳理
LPU产业链核心环节包括:芯片设计、SRAM存储、高多层PCB、电子布、先进封装、边缘计算、液冷等。
1. 芯片设计
LPU的核心是面向大模型推理的专用芯片架构设计。
• 海外:
◦ Groq:LPU架构开创者,推理性能标杆;
◦ 英伟达:通过合作+自研,将LPU融入Feynman等新架构,强化推理生态;
◦ 谷歌、AMD:以TPU、MI系列布局推理,暂未推出专用LPU。
• 国内:
寒武纪、海光信息、无问芯穹、芯原股份、燧原科技、登临科技、云天励飞等均在推理芯片、NPU IP、LPU相关架构上有所布局。
2. 存储芯片:SRAM
LPU与传统GPU/TPU最大区别之一,是以片上SRAM为核心存储,而非依赖HBM。
• SRAM带宽高达约80TB/s,数据可在芯片内就近计算,大幅降低延迟与功耗;
• Groq LPU搭载230MB SRAM,可实现大模型高速Token生成,速度较传统GPU提升约10倍;
• 瑞银测算,LPU凭借SRAM近存架构,可实现推理吞吐量7.5倍以上提升。
国内SRAM相关厂商:
北京君正、兆易创新、恒烁股份、后摩智能、昆仑万维、炬芯科技等。
3. PCB(高多层板)
PCB是LPU、GPU、存储等芯片的电气连接与承载载体,LPU对PCB的技术要求与价值量远高于传统服务器:
• 单块LPU平台PCB价值为传统服务器的5–7倍;
• 需支持30层+、50层+超高多层设计;
• 推动M9材料、背面供电、嵌埋PCB、CoWoS配套方案加速渗透。
国内PCB核心厂商:
沪电股份、胜宏科技、景旺电子、深南电路、广合科技、生益科技、鹏鼎控股、东山精密、兴森科技、崇达技术、中京电子等。
4. 电子布(高频高速基材)
电子布是PCB核心基材,与树脂制成覆铜板(CCL)后用于PCB生产。
AI服务器与LPU芯片推动PCB向M9材料、超低轮廓铜箔、Q布/石英电子布升级。
第三代Q布介电常数低至2.2–2.3,专为AI高频高速场景设计,是当前供应最紧张的关键材料之一,全球产能高度集中、技术壁垒极高。
核心电子布厂商:
海外:日东纺、AGC、旭化成、信越;
国内:菲利华、中材科技、国际复材、宏和科技等。
发布于 广东
