最近智谱GLM 5.2的讨论非常火,而Deepseek也发布了新的加速工具DSpark,原理被称为投机解码。
DSpark的发布意义重大,它是一套成熟的通用大模型加速器,并不是针对Deepseek。Qwen3(4B/8B/14B)、Gemma4-12B 都跑通。它能让推理侧加速百分之五十左右。因为它是通用且可落地的(之前也有类似的投机解码方案,但落地困难),这不是某家公司的技术优势,而是全行业推理成本的一次性下修
我判断短期是有可能有恐慌情绪的,但市场也是相信杰文斯悖论的,只不过这个悖论需要时间发酵,长期仍然是利好。我的思路如下:
英伟达一直把 AI基建升级描述了一个非常紧迫的事情,The more you buy, the more you save.似乎的云大厂不买它的GPU就会跟不上时代而消亡。然而 DeepSeek 一个算法提升就能再榨出 50%+ 的等效算力,智谱Z.AI用华为便宜的显卡也能训练出GLM5.2级别的模型,更贵更快的下一代Rubin 架构还有那么急吗?
智谱和Deepseek的成功,这本质上是对英伟达「硬件军备竞赛叙事」的一次短期预期冲击。
我的判断是
训练端:Rubin 该买还是得买,训练是「时间竞赛」,早一天训完早一天上线,时间价值远大于硬件成本不是需求没了
推理端:是「紧迫性」降低了,不是需求没了,短期叙事会降温。长期来看会回归杰文斯悖论,瓦特改良蒸汽机后卖煤的不用担心煤会卖得少反会增加。
$英伟达(NVDA)$ $智谱(02513)$#1927只个股创近1年新低#
发布于 广东
