白水山人记 26-02-08 12:00
微博认证:投资内容创作者

算力缺口将持续到2027年 
Agent爆发带来的算力缺口是底层逻辑改变带来的质变增长,并且是指数增长。 
单Agent算力消耗是传统Chatbot的100-1000倍,算力缺口将持续至2027年Q2,部分高端环节可能延至2030年。 

1)Agent如何引爆算力缺口 
任务性质质变:从“聊天”到“执行”的算力跃迁 
比如千问,一句话点外卖,这背后对token的消耗是巨大的。 
Token消耗爆炸:传统#Chatbot#单次交互约2,000 token;Agent启动阶段1-2万 token,单步思考20万+ token,完成项目总消耗达百万级,是普通用户的100-1000倍 
CPU成为核心瓶颈:#Agent#任务中**90.6%端到端延迟消耗在CPU(工具调用、任务拆解、逻辑判断),GPU仅负责不到20%**密集计算 
并发模式重构:从“用户触发”到“7×24小时自主工作”,长任务并发率从ChatGPT的1%飙升至Agent的30%-40%,资源持续占用不释放 

2)算力核心全面缺货 
缺卡众所周知,不再赘述: 
#Kimi#(月之暗面)在2026年2月5日公开求卡: “是真的缺卡。已扩容几次了,还是缺。” 
存储到目前也涨价好几倍,从GPU到存储,CPU也面临缺货延期。先进制程优先排产GPU,材料优先供给等,多种因素叠加导致缺货爆发。 
(利好国产替代,光刻机、光刻胶) 

3)算力缺口持续到27年 
算力缺口或持续到27年,部分高端环节紧张可能延至2030年。 
硬件供给本身受限,算力核心硬件(GPU、HBM、先进封装、CPU)的扩产周期都在18-24个月以上。 
算力需求不是“线性增长”,而是指数级+结构性质变,2026-2027年将迎来“训练+推理+边缘”三端共振,进一步拉长缺口周期。  

还有一个非常非常非常重要的问题,区域错配。 
大多数郭嘉都不允许数据出海,所以跨国企业就要在当地建立数据中心。 
在跨国企业待过的小伙伴都知道,有些芝麻大小的都要求数据不能出海,咱不说小地方,老美、龙村、欧洲你得搞吧?这些都是新的增长。 

#特斯拉£昨天也宣布了国内的AI训练中心投入使用。国内小鹏出海欧洲,智驾也得在欧洲建立AI训练中心。 
我之前甚至在想,有没有可能在巨轮上建一个数据中心,然后跑过来跑过去复用硬件,数据依然本地,训练卡可以到处跑,不知道可行不可行。 
总之,#算力£缺口很大,还将持续!#微博股票[超话]#

发布于 上海