王川:当隔壁老王投资存储股票赚了三十倍后,如何还能不焦虑 (五)- 牛鞭效应
摘自硅谷王川 investguru
1/ 建造大型数据中心,是个很复杂的工程。第一需要巨大和稳定的能源供应, 第二需要能源和数据中心联网,第三需要各种定制的重型器材。
2/ 和电网的连接不止是个工程问题,还涉及到环保,对电网稳定性和电价的影响,等各种复杂的需要研究和审批的事项。任何一个关口卡壳,都会耽误很长时间。即使一个项目搞定了能源供应,要让监管者批准和电网的连接,并在工程上落实,至少需要三到五年时间,有的地区甚至更长。
3/ 连接电网的大型数据中心需要电力变压器,把来自电网的高压电层层转换,变成数据中心的器材可以使用的电压。变压器有不同等级,目前最缺的是变电所的高压变压器,据说交货时间因为订单太多, 已经延迟到三到五年。缺货的原因是因为制造工序和供应链极为复杂,需要各种定制的零部件,特殊的材料,等等。
4/ 有人会说,没关系,我可以不用和电网连接,也不用大型变压器,我现场租用燃气轮机 (Gas Turbine),用天然气发电!事实上,马斯克的 xAi 就是这样,2024年只花了四个月时间,搭建起自己的第一个数据中心 Colossus 1。但是这条路径现在又有新的问题:一是环境污染和能源浪费较大,导致各地政府监管力度加大。二是需要稳定的天然气供应。三,现在燃气轮机供不应求,新订单的交货时间已经超过五年。
5/ AI 投资观察者 Ed Zitron 最近发表了一篇文章,“数据中心去哪儿了” ? ( Where are all the data centers?) 。文章指出, (除了 xAi的 Colossus 超算中心之外),各个公司过去两年上线的数据中心规模最大也就是两百到三百兆瓦,大部分真正完工的项目都在 50兆瓦以下。OpenAI 和 软银在 2025年一月高调宣传的四年投资五千亿美元,26年底要上线1200兆瓦的 Stargate 数据中心项目,迄今为止只有两个总共 210 兆瓦的数据中心上线。某大公司高调宣传过去两年有四千兆瓦的算力上线,但如果仔细盘点它过去三年开工的各个数据中心项目,没有任何公开信息可以证明任何项目已经完工。媒体宣传时常常玩文字游戏刻意误导,比如某个数据中心项目里 N 幢楼只有一两幢上线运营,记者的文字会给读者以整个项目全部完工的错误印象。而四月份彭博社的一篇文章号称,今年在美国建造的数据中心项目,大约一半会推迟甚至彻底取消。
6/ 当数据中心的建设上线时间需要至少三到五年,而 GPU 的交货时间只要 6到 12个月,一个不可避免的结论是,云服务商要么必须减少 GPU 的订单以和数据中心建设进度同步,要么必须容忍自己买来的 GPU 放在仓库里静静的吃灰,越堆越多。
7/ 一个观察公司囤货增加的角度是看所谓 “Construction In Progress” ( 在建工程) 或者 “Asset not yet in service” (未投入使用资产)。 比如谷歌 25年三月底的时候,未投入使用资产价值为 556 亿美元,一年以后这个数字上升为 1086 亿 ; 脸书的在建工程,25年三月底为 323 亿,26年三月底上升为 610 亿 ; 亚马逊每年只披露一次这方面的数据,24年底到 25年底在建工程从 466 亿上升为 717 亿。微软没有直接披露这方面的数字。但整体看,除微软外的三家大公司的”尚未投入使用的资产“过去一年从 1340 亿美元增加到 2410 亿美元,净增 1070 亿美元,增长幅度为 80%。 如果假设未投入使用资产中有 30%为 GPU, 那么 1070 亿美元的增量就是 321 亿,正好相当于一百万台在仓库里吃灰的英伟达的 Blackwell GPU。
8/ 这里需要引入一个供应链管理的概念:牛鞭效应 (Bullwhip effect)。 简而言之,牛鞭效应是指实物商品从销售到生产的各个环节之间存在较大的时间延迟,因此来自终端买家的订单的微小波动,就可以导致后台生产商的生产量的大幅波动。这好比终端买家挥舞着一个牛鞭,轻轻一动就可以导致鞭尾的大幅波动,所以叫牛鞭效应。
9/ 牛鞭效应的成因主要有两点:一,生产环节复杂,延迟较长,需求上升期时延迟增长更快,雪上加霜 ; 二,每个环节上的买家只能看到自己的客户的需求,对市场整体需求的变化主要靠猜,上升期时为了让自己有冗余,通常向上游供货商开出比自己实际收到需求要多出一些的订单数目,每个环节大家层层加码,最后导致后台生产商的生产量的巨大波动。
10/ 牛鞭效应的最反直觉的两点在于:一,当客户订单开始加速涌入时,不管你开始如何向上游增加订单,因为生产的延迟,会有很长一段时间,缺货现象会越来越厉害,而竞争压力会诱导你大幅度增加更多订单。 二,当供需关系变得平衡之后,即使你立刻取消所有订单,已经开启生产的货物仍然会源源不断的进入市场,很长一段时间供过于求的问题会越来越糟。
11/ 从供不应求到供过于求的临界点的转换很难提前预测,形成原因也非常复杂。有时是因为供给终于上来了,有时是因为价格过高导致终端买家的需求减少,或者经济衰退,或者买家找到了替代解决方案。转换的发生是瞬间的,就好像一个拥挤的酒吧突然着火,原先淡定的狂欢者,突然同时决定冲向一个逃生的窄门。
12/ 因为延迟和缺乏准确全局信息,因为害怕落后于竞争者,每个环节上的参与者都会在局部缺货的时候义无反顾的增加订单,造成上游的更多的缺货,更多价格上涨,和更多投机者的义无反顾的涌入。而一旦供给远远超过需求时,大家不断砍订单,甩卖存货,反向的价格下跌,投机者破产的现象又会层层向下传播,把价格推向另外一个极端。
13/ 历史上若干次酒吧失火,大量人员伤亡的惨剧,本质都是因为出口太小,火势过临界点后大家同时想夺路而逃,人员踩踏导致出口被彻底堵死,最后大家一起堵在出口窒息而亡。 从无忧无虑的狂欢,到出口被堵死的时间,很多时候不到 100秒。而且起火的开始几十秒,很多人还会误以为这是狂欢节目的一部分,完全没有撤离的想法。 和你一起在酒吧狂欢的其他人,根本不是你的朋友,而是起火后和你一起在门口互相践踏,共赴黄泉的竞争者。
14/ 类似的,很多资产泡沫,从东窗事发,到价格下跌 50% 以上,往往就是两三个星期,甚至一两天的事情。开始下跌 10%的时候,大家通常不在意,以为是正常的回调。跌过某个临界点后,所有大基金,散户都在竞相恐慌的抛售,跌得越多,就会有更多人恐慌,导致更大的下跌。 在泡沫上升期,互相鼓气的狐朋狗友,在恐慌期,统统变成自相残杀的猪队友。他们的思维模型里,无法真正理解为什么资产从高涨到暴跌的转换可能就是几天的事情,因此最终的悲惨结局很早就已注定。
15/ 所以现在大致的格局轮廓就清晰了:
i/ 几大云服务商竞相穷尽经营现金流,增长资本性投入,负债累累,同时建设大量数据中心或签下大量长期租约,推动整个半导体行业的收入和利润暴涨。
ii/ 但行业的瓶颈已经转移到数据中心的建设,工期一拖再拖,在建工程和GPU 存货的金额也在增长。能源供应,电网连接,变压器,燃气轮机等等各种瓶颈,砸再多钱, 也无法立刻解决。
iii/ 整个半导体产业过去三年多处于牛鞭效应的上升期。很多观察者看到短期各种供不应求的强劲数字,误以为形势还会继续下去,误以为自己可以精准逃顶。
发布于 河南
