近期存储板块出现调整,主要受谷歌TurboQuant、DDR4价格疲软等因素影响,但我们认为短期扰动不改长期趋势持续看好本轮存储超级周期
1。谷歌推出TurboQuant新型AI内存压缩算法,可将大模型KV Cache内存占用减少6倍,推理加速最高8倍。
TurboQuant旨在提升单GPU吞吐量,降低单次查询成本,# 并非减少内存硬件部署。
TurboQuant仍然处于技术讨论阶段,#成本优化和效率提升是AI普及过程中必然出现的阶段。
内存压缩技术大幅降低了AI的推理与部署成本,打破了原本限制AI普及的# 内存墙。单机内存消耗的节流,会被云端和边缘端设备呈指数级爆发的开源所远远覆盖。
多模态、物理AI等带动大模型参数继续飙升,软件层的技术优化只是#让更大的模型得以跑通,最终倒逼底层硬件不断扩张,继续做大整个存储产业。
2。根据TrendForce内存现货价格趋势报告,DRAM现货市场上涨势头受阻。
DDR4内存价格疲软主要是节前渠道放货的因素扰动,# 原厂产能仍然紧张。
相比DRAM,NAND涨价周期#滞后半年以上,DRAM主升浪开启于25Q2,NAND主升浪开启于25Q4。从涨幅来看,DRAM本轮涨幅数倍甚至数十倍,而NAND涨幅仅一两倍,#NAND仍然处于快速涨价的通道。
推理时代NAND重要性提升 Rubin架构推动AI推理向分层内存体系(HBM + DRAM + NAND)演进,部分长上下文与低频数据从HBM外溢至更低成本存储,从而提升NAND在AI系统中的容量需求
#微博股票[超话]#
发布于 上海
