26-06-29 08:53 微博认证:财经观察官 科技博主

最近智谱GLM 5.2的讨论非常火,而De­e­p­s­e­ek也发布了新的加速工具DS­p­a­rk,原理被称为投机解码。
DS­p­a­rk的发布意义重大,它是一套成熟的通用大模型加速器,并不是针对De­e­p­s­e­ek。Qw­en3(4B/8B/14B)、Ge­m­ma4-12B 都跑通。它能让推理侧加速百分之五十左右。因为它是通用且可落地的(之前也有类似的投机解码方案,但落地困难),这不是某家公司的技术优势,而是全行业推理成本的一次性下修
我判断短期是有可能有恐慌情绪的,但市场也是相信杰文斯悖论的,只不过这个悖论需要时间发酵,长期仍然是利好。我的思路如下:
英伟达一直把 AI基建升级描述了一个非常紧迫的事情,The mo­re you buy, the mo­re you sa­ve.似乎的云大厂不买它的GPU就会跟不上时代而消亡。然而 De­e­p­S­e­ek 一个算法提升就能再榨出 50%+ 的等效算力,智谱Z.AI用华为便宜的显卡也能训练出GLM5.2级别的模型,更贵更快的下一代Ru­b­in 架构还有那么急吗?
智谱和De­e­p­s­e­ek的成功,这本质上是对英伟达「硬件军备竞赛叙事」的一次短期预期冲击。
我的判断是
训练端:Ru­b­in 该买还是得买,训练是「时间竞赛」,早一天训完早一天上线,时间价值远大于硬件成本不是需求没了
推理端:是「紧迫性」降低了,不是需求没了,短期叙事会降温。长期来看会回归杰文斯悖论,瓦特改良蒸汽机后卖煤的不用担心煤会卖得少反会增加。
$英伟达(NV­DA)$ $智谱(02513)$#1927只个股创近1年新低#

发布于 广东