半导体HBM七和三台一尖
26-01-20 07:14

大模型增加"记忆力和向量数据"五年的全球方向(符合梁宁的双增长5年内没有天花板)

长上下文(100万→1000万+token)与分层存储升级,核心是HBM容量/带宽/堆叠提升+数量扩容,5年增速由“爆发→放缓→稳健”,主流机构预测2026-2030年CAGR约33%。

一、5年HBM年增速(2026-2030,主流机构口径)

• 2026:+35%~+50%(基数高、HBM4量产爬坡)

• 2027:+25%~+40%(HBM4普及、AI服务器放量)

• 2028:+20%~+30%(HBM5推出、供给改善)

• 2029:+15%~+25%(增速趋稳、技术迭代放缓)

• 2030:+10%~+20%(市场成熟、渗透率见顶)

• 关键备注:2023/2024出货量同比+187%/+193%属短期爆发,2026后回归高增长但非翻倍。

二、HBM升级与制程/堆叠对应

• 容量/带宽升级:HBM3→3E→4→5→6→7;容量8→12→16→20层;带宽1.2TB/s→2TB/s+;键合D2W→混合键合→W2W。

• 逻辑Die(Base Die):HBM3→28/14nm;HBM3E→7nm;HBM4→4/5nm;HBM5+→3nm+(提升吞吐、降功耗)。

• DRAM颗粒:1b→1c→1d(≈10-12nm),靠堆叠/键合提性能,不做≤7nm微缩。

三、DDR5/LPDDR5升级路径

• 颗粒:1b→1c→1d(≈10-12nm),EUV工艺。

• 速率:DDR5-6000→8000→10000+;LPDDR5→5X→6(低功耗优化)。

• 核心:靠制程微缩+速率提升,不用≤7nm,技术门槛低于HBM。

四、SSD升级路径

• NAND:200→300→400+层堆叠(20-1Xnm级,靠堆叠提容量)。

• 主控:10nm→7nm→5nm(提升IO与能效)。

• 接口:PCIe 4.0→5.0→6.0(提升传输速率)。

以下为2026-2030年HBM/SSD/DDR5/LPDDR5的年增速与5年CAGR极简清单,口径为全球市场规模(主流机构综合,便于横向对比):

一、年增速速览(单位:%)

• HBM:2026(+35~50)、2027(+25~40)、2028(+20~30)、2029(+15~25)、2030(+10~20);5年CAGR≈33%

• SSD:2026(+25~30)、2027(+20~25)、2028(+15~20)、2029(+10~15)、2030(+8~12);5年CAGR≈12~15%

• DDR5:2026(+40~50)、2027(+30~40)、2028(+20~30)、2029(+15~25)、2030(+10~20);5年CAGR≈18~22%

• LPDDR5:2026(+35~45)、2027(+25~35)、2028(+18~28)、2029(+12~22)、2030(+8~18);5年CAGR≈15~19%

二、核心规律与关键备注

• 增速排序(从高到低):HBM > DDR5 > LPDDR5 > SSD。HBM因AI大模型长上下文需求最强,DDR5/LPDDR5随服务器与移动端渗透率提升高增,SSD由企业级与数据中心驱动但消费端趋稳。

• 共性节奏:2026-2027为高增期(供给偏紧),2028后增速逐季放缓,2030进入稳健增长期。

• 制程门槛(与增速匹配):HBM逻辑Die需4/5nm→3nm,整体技术壁垒最高;DDR5/LPDDR5颗粒≈10-12nm(1b/1c/1d),不用≤7nm;SSD主控7→5nm,NAND靠堆叠升级,制程门槛相对低。

三、升级路径极简版

• HBM:HBM3→3E→4→5→6→7;容量/带宽/堆叠层数提升,逻辑Die制程从28/14nm→7nm→4/5nm→3nm+,DRAM颗粒≈10-12nm不微缩。

• DDR5:速率6000→8000→10000+;颗粒1b→1c→1d(≈10-12nm);靠EUV提性能,不做≤7nm。

• LPDDR5:LPDDR5→5X→6;速率6400→8533→9600Mbps;低功耗优化,制程≈10-12nm。

• SSD:NAND堆叠200→300→400+层;主控10→7→5nm;接口PCIe 4.0→5.0→6.0;容量/IO/能效同步提升。

核心结论:是的,token时长/数量增加,向量数据会同步大幅增加,且是“超线性增长”。以下是关键逻辑与量化关系:

一、向量与token的绑定关系

• 每个token对应一个固定维度向量(如768/1024/12288维),token越多,输入向量总量必然越多。

• 训练/推理中,还会产生KV缓存向量与隐藏状态向量,它们随token序列长度增加而膨胀,是显存主要负担。

二、量化与增长规律

• 基础向量:token数×向量维度(如100万token×1024维→102.4亿个数值)。

• KV缓存:每token对应两组向量(Key/Value),长度与序列长度正相关,推理时随上下文拉长而快速增长。

• 隐藏状态:每token在每一层都有隐藏向量,层数越多、序列越长,总量越大。

• 增长特征:token增加→向量总量超线性增长(Attention计算复杂度O(n²))。

三、向量增长的应对与投资启示

• 技术应对:HBM堆容量/带宽(解决显存瓶颈)、KV缓存优化(如PagedAttention)、分层存储(HBM存热数据,DDR/SSD存冷数据)。

• 投资启示:向量数据暴增→HBM需求最强、增速最高;DDR5/LPDDR5次之;SSD用于冷数据扩容,增速相对平稳。

四、与其他存储的增速关联

• HBM:5年CAGR≈33%(最高,直接匹配向量数据增长)。

• DDR5:CAGR≈18-22%(服务器内存扩容)。

• LPDDR5:CAGR≈15-19%(移动端适配)。

• SSD:CAGR≈12-15%(冷数据与RAG存储)。

发布于 江苏