算力租赁与CPU的下一站:超节点 OEM,做具确定性的公司(附名单)
4月下旬以来,全球大模型的实际调用量发生了比较明显的变化。国内头部大模型的单周交互数据超过美国同行,在普通用户端,拥有上亿用户的应用正式推行了分层订阅付费机制。这意味着人工智能行业正从免费试用阶段,逐步走向商业化变现。应用端的推理需求向上传导,打破了底层硬件设备的供需平衡。
本次梳理基于最新的产业动态与业务数据,拆解当前的硬件供应紧张状况,重点分析了超节点整机与中央处理器环节的涨价逻辑和相关企业动向。
一、应用增长推高算力投资
底层硬件的需求完全取决于上游软件的使用频率与商业回报。全球维度的最新统计反映了一个明显的趋势,国内大模型在实际应用中的普及速度正在加快。根据4月27日至5月3日的数据,在全球调用量排名前九的大模型中,国内模型占据了六个席位,总调用量达到7.942万亿个词元。经过两周的追赶,国内模型的单周调用规模再次超过了美国。随着多模态生成等高频场景的增加,底层算力的消耗呈现出量级增长的态势。
应用端的商业化尝试为这种庞大的算力开支提供了资金支撑。5月4日豆包宣布推出从每月68元到500元不等的分层订阅服务,彻底打破了国内行业长期依赖免费模式的现状。同时企业的调用量也在急速增加,截至5月7日腾讯的混元3预览版上线仅仅两周,其调用量就增长了十倍。
基于明确的商业化前景与庞大的算力消耗,国内主流云服务厂商开始大幅上调未来的基础设施预算。阿里巴巴正在考虑将未来三年用于人工智能基建和云计算的3800亿元预算提高到4800亿元。腾讯在2025年投入792亿元之后,也明确表示2026年会继续增加这方面的开支。字节跳动的动作则更为激进,不仅将2026年的人工智能资本开支计划上调了25%至2000亿元以上,还在海外大规模加码,包括在泰国获批的250亿美元数据中心基础设施投资计划,以及向芬兰数据中心追加的10亿欧元建设资金。
二、高端算力紧缺与租赁暴利
巨头们手握巨资扩建算力,但硬件供应跟不上。高端计算卡的交货周期越来越长,价格也一涨再涨。以H100为例,其一年期租约的合同价格从2025年10月的每小时1.70美元,一路暴涨至2026年3月的2.35美元,涨幅将近40%。在现货租赁市场中,按需租赁的容量指标在所有类型的图形处理器中都已经显示售罄。更新一代的硬件价格更是水涨船高,5月9日的平台数据显示,AWS上的B200现货价格达到每小时36.73美元,按需价格高达113.93美元。国内市场中B300人工智能服务器的单台成交价已经从去年底的400万元人民币翻倍至约700万元。
这种极端的供需错配造就了算力租赁行业的暴利期。2026年第一季度国内算力租赁市场规模达到了680亿元,同比增速高达62%。行业内的代表性企业迎来了业绩的高速释放期,利通电子一季度净利润达到2.7亿元,同比暴增821%,协创数据的净利润也达到7.5亿元,同比增长343%。
为了维持这种高增长,租赁企业正在利用金融工具疯狂扫货。协创数据公布了不超过110亿元的服务器采购计划,盛视科技也累计发布了71亿元的设备购买公告。这些企业只要能通过大额融资锁定硬件设备的采购渠道,就能依托行业的长期租赁合同快速将算力转化为实际的财务收益。
三、超节点系统与代工溢价
面对如此庞大的推理需求,简单的单卡堆叠已经无法满足大型数据中心的效率要求。行业的主流架构正在向超节点系统演进。这不再是传统的将几张显卡插在主板上,而是通过极高速的互联协议和专用的交换芯片,将几十甚至几百颗芯片在逻辑层面整合成一个统一的协同计算系统。
超节点架构保留了单颗芯片的物理独立性,但通过统一的虚拟内存地址空间和无损网络互联,让开发者在编写程序时感觉就像在使用一台极其庞大的单机。这种系统极度复杂,融合了多芯片封装、整机硬件设计、热量管理以及配套的底层软件。以英伟达的Vera Rubin机架为例,整个系统包含了130万个独立组件和近1300个芯片,总重量约两吨。
这种技术复杂性的急剧上升,直接改变了服务器代工厂的商业地位。以往的硬件组装是标准化和容易被替代的,但在超节点时代,价值的重心转移到了复杂的定制化系统设计、深度调优和全栈集成服务上。掌握这些核心能力的头部代工企业,能够获得比以往更高的产品溢价以及客户粘性。
更重要的是这种复杂系统带来了确定的后期维护收益。超节点一旦进入规模化部署,后续的维保服务就成为了刚性需求。由于系统的运维门槛极高,只有具备原厂认证和专业级交付能力的服务器厂商,才能吃下这块持续扩大的售后市场利润。
四、国产超节点与算力突围
在海外高端算力持续受限且价格高昂的背景下,国内企业开始主动调整策略,弱化对单一算力生态的依赖。4月底DeepSeek-V4在昇腾生态首发,虽然受限于目前的硬件吞吐能力,但企业已经明确表示,下半年昇腾950超节点批量上市后将大幅下调服务价格。
支撑这种国产算力替代的,是底层晶圆制造产能的持续释放。中芯国际在2025年第四季度的月产能已经增加至105.875万片8英寸约当晶圆,产能利用率保持在95.7%的高位。华虹半导体也在持续扩产,其FAB9B项目总投资38亿元,计划建设一条月产能5.5万片的12英寸生产线。晶圆厂的产能保障,大幅降低了芯片的交付周期,为国产超节点整机的规模化量产提供了充足的物料基础。
从实际落地进度来看,国产超节点正在经历从单点验证到系统级部署的关键跨越。中科曙光用不到半年的时间,就完成了从产品发布到3万卡乃至6万卡集群实际落地的全过程。
在运营商层面,中国移动首次启动了人工智能超节点设备的集中采购,河南昆仑、长江计算、华鲲振宇、宝德计算机和华启智慧共同中标了这一项目。这标志着底层网络运营商的算力建设正在从传统的服务器堆叠向高性能超节点架构转型。
在出货指引上,华勤技术表示其超节点产品在第二季度已经实现小批量发货,预计下半年进入大批量发货阶段,全年对应的收入规模将超过100亿元。
五、处理器涨价与库存红利
在图形处理芯片大受关注的同时,原本被市场忽视的中央处理器也迎来了反转。随着业务场景向人工智能推理转移,服务器内部中央处理器与图形处理器的配置比例正在从此前的1比8回升至1比4。英特尔预计在2026年和2027年,其服务器处理器的出货量将实现两位数增长。AMD更是将2030年服务器处理器的总可取用市场规模上调至1200亿美元。这背后的逻辑在于,进入人工智能代理时代后,大量的逻辑判断和控制调度需要更多的通用计算核心,预计总需求将从传统的3000万个核心大幅增加至1.2亿个。
需求回暖直接催生了持续的涨价周期。英特尔计划在2026年5月进行年内的第三次提价,相比2025年其服务器处理器的累计涨幅将达到30%。AMD在2026年的累计提价幅度也预计将达到16%到17%。
这种上游芯片的涨价,为处在中间环节的服务器代工企业带来了意想不到的盈利弹性。服务器是这些处理器最重要的出货渠道。这就类似于之前存储芯片涨价时模组厂商大赚一笔的逻辑,目前手里握有大量低价处理器库存的服务器整机企业,在本轮提价周期中拥有了充足的产品定价权。他们在卖出新服务器时可以按照最新的高额芯片成本进行定价,从而将其此前囤积的低价库存转化为显著的账面利润。
六、重点公司
1. 超节点OEM:浪潮信息、华勤技术、中科曙光、紫光股份、工业富联、中兴通讯。
2. 算力租赁:协创数据、宏景科技、盛视科技、利通电子、盈峰环境、智微智能、润泽科技、润建股份、东阳光、赛意信息、蜂助手、行云科技、圣阳股份。
3. CPU:海光信息、中国长城
4. AI芯片:寒武纪、芯原股份、沐曦股份、壁仞科技、天数智芯。
5. 连接:澜起科技、盛科通信、锐捷网络、华工科技、华丰科技、鼎通科技。
6. IDC:世纪互联、大位科技、云赛智联、光环新网、数据港。
以上,仅供参考。
发布于 北京
