美股存储走势不好,是因为昨天有个利空:
昨天谷歌研究院在官方博客发布了 TurboQuant 压缩算法。核心能力:将大模型的 KV Cache 压缩至 3-bit(原通常为 16-bit 或 32-bit);内存占用缩小 超过 6 倍;在 H100 GPU 上推理速度提升 最高 8 倍。无需重新训练或微调模型,可直接部署。
影响:
AI 推理成本:大幅降低长文本推理的显存需求,让大模型在消费级硬件上跑更长上下文成为可能。
硬件格局:对高显存 GPU(如英伟达 H100/A100)的需求逻辑形成冲击,美股存储板块已因此出现波动。
技术方向:标志着无训练量化压缩成为 AI 效率优化的重要突破口。
短期看,对存储是有点情绪冲击,但长期看,存储的需求不仅仅不会降低,还会增加。因为成本下来了,需求会越来越大。
发布于 上海
