鲍迪克 26-04-05 11:24
微博认证:《北大商业评论》首席编辑鲍迪克 微博原创视频博主

【TurboQuant算法,对存储器反而是利好?】3月26日,谷歌研究院发布TurboQuant算法,称该技术可在不影响模型精度的前提下,将大模型推理时的KV Cache内存占用降低至少6倍,在英伟达H100上最高可实现约8倍的性能提升。
这一技术被视为可帮助硬件厂商和AI公司减少高带宽内存(HBM)用量。受此消息影响,全球存储器板块剧烈调整。但对于TurboQuant算法的影响,市场存在不同解读:
摩根士丹利指出,市场可能存在误读:该技术仅作用于推理阶段的键值缓存,不影响模型权重本身占用的HBM。其核心是通过提升单GPU吞吐量,以支持更长上下文或更大批次处理,而非直接减少总内存需求。
从历史经验和市场逻辑看,效率提升往往激发更多应用需求,根据“杰文斯悖论”,次技术对硬件需求的长期影响为“中性偏正面”。就像唱片技术,电影技术取代戏班子的戏台演出,播放加了千倍、万倍,但因为播放效率提高和成本降低,对演员和演艺行业的需求反而大了几百倍……
此次事件与2025年1月的DeepSeek事件有相似之处:均在短期内引发市场对基础设施投入的担忧,实际结果却可能相反:效率提升通过降低成本加速了AI应用渗透,反而带动了更广泛的资本开支。就像煤炭石油能源效率远高于木材,但人类反而大大增加了对能源行业的资本开支……
    估计在推理内存需求持续增长、云厂商资本开支长期确定性的背景下,HBM与DRAM的结构性需求依然强劲,TurboQuant难以对其形成实质性影响,其对NAND需求的影响也相对有限,整体结论偏正向。#内存条价格出现断崖式下跌##存储器##A股#

发布于 北京