现有针对Deepseek的舆情讨论,已经变成“低算力需求论”开始横行了,这很危险。
算力这个词,内涵是很丰富的,它不是单纯的堆卡问题,美国在算力领域的领先,也不是单纯因为卡多。
比如云计算这个环节,我们依然有很长很长的路需要去追。中国这几个云,除了王坚院士在阿里拼出一条血路来,还有华为云跟进搞出一些成绩来,剩下这几个“云”,有哪个现在有底气站出来说,如果2025年Deepseek的开源进度提速,中国中小企业大量部署云侧加端侧的微调模型要搞应用突破了,他们100%能不宕机让大家的云算力需求跑起来?
如果这块问题不解决,最终NV卡的价格是被打下来了,受益者反而是AWS这些真正能提供云端部署和持续训练推理能力的美国厂商,从一种卡脖子换成另外一种卡脖子,一样很难受。你不可能指望中国B端企业能马上打通纯本地部署能力的问题,美国不缺卡同样解决不了这个问题,云和端的协同问题大家都要面对。
即便是国产算力芯片这个看似进度相对最快的环节,我们目前问题也很多。
不谈SMIC产能问题这种大家都心知肚明的事了,目前昇腾寒武纪海光几家的思路还停留在NV卡的国产替换思维上,而且各家出发的初始原点状态也不同,昇腾是做非AI的数据中心的底子,寒武纪的产品结构上有不少当年NPU做协处理器的底子,海光的D1和D2明显能看到在超算应用和普算应用上艰难折衷,这种G端和B端需求杂糅的算力基座状态,是存在很多隐患的。
字节25年资本开支里为啥还要以H20做基础,就是需要给国产算力芯片企业们更长的转弯时间,几家拼一拼,拼出真正能在B端的大CSP们能放心部署大规模集群的产品方向来。
另外,我们在ASIC方向上,实质上的差距还是被越拉越大了。
哪怕就是没有各种禁运压力,mrvl和avgo在2025-2026年的产能我们也抢不过美国那几家CSP,他们现状的现金流收入太强了,字节那块ASIC能不能正常排产目前都有很大的变数,更不要说其他几家被各种反垄断打压和国内经济不景气下的恶性内卷折腾的很严重的其他国内CSP了。
这个方向是目前最有可能爆发出技术加速状态的地方,Google的TPU团队分离出去搞Grop那帮人,很可能成为一条鲶鱼。对N卡的各种问题,美国人用的比我们多,也就理解上比我们透彻,他们找到类似LPU这种新计算架构的可能性是很大的。
如果放任现在这种盲目乐观的舆情继续传播和渲染,最终影响某些技术思维并不强的决策层做出一些错误的判断,觉得我们真赢了,该做的很多恶补动作都没必要做了,那才是真的大麻烦来了。鉴于过去曾经发生过的类似的CTBZ行为,这种事发生的概率,并不低。
所以,就是被骂死,我也要发声,坚决抵制各路并没有足够专业技术分析能力的KOL,在这胡乱带节奏。
发布于 北京
