朱新宝2026 25-09-10 18:45

算力核心赛道:数据中心硬件六大核心全解析:[good]

英伟达CFO科莱特在近期高盛技术会议上表示,在接下来5年内,数据中心基础设施相关的资本开支将达到3万亿至4万亿美元。

当前全球科技巨头持续加大AI投资,引领云市场和数据中心持续扩容,有望带来算力需求全面机遇。

本文主要解算力基建核心环节:AI数据中心。

01:AI数据中心行业概览

AI数据中心是算力核心底座,是专为支持人工智能计算任务设计的新型基础设施。

在计算架构方面,AI数据中心CPU+GPU/NPU异构加速,大规模并行计算;单机柜率达到12-132kW(液冷渗透率超20%);成本结构中硬件成本占比60%+,能源成本25%;此外,超大规模集群万卡级GPU协同调度。

在AI数据中心建设中,算力硬件作用贯穿AI全生命周期,其成本占比显著高于传统数据中心,是数据中心初始投资的最大环节。

硬件总体占比:IT设备(服务器、存储、网络等)占AIDC总建设成本的70%-80%,其中服务器占比近70%。聚焦AI训练场景,由于需采用高算力GPU/ASIC等加速卡,服务器成本占比可升至40%甚至更高,传统数据中心约25%。

AI算力硬件产业链六大核心环节:芯片、服务器、存储、网络、散热、电源,形成“硬件定义算力,生态决定竞争力”的格局。

02:AI算力芯片

AI芯片也被称为AI加速器或计算卡,是专门针对人工智能领域设计的芯片,是算力的核心基石.

Al芯片分类:主要分为GPU(图形处理器)、FPGA(现场可编程逻辑门阵列)、ASIC(专用集成电路)三大类。

GPU主导AI计算市场,FPGA和ASIC则是针对人工智能需求特征的半定制和全定制芯片。

GPU:AI服务器中加速芯片的首选,其价值量占AI服务器高达70-75%。英伟达占据主导地位,AMD紧随其后,海外厂商英特尔、高通、ARM等厂商都是该市场重要参与者。国内厂商HW、景嘉微、海光信息、寒武纪、芯原股份、龙芯中科、摩尔线程等加速引领国产替代。此外,壁仞科技、沐曦、天数智芯、燧原、瀚博、后摩智能、芯瞳、登临科技等深度布局。

当前海外ASIC传统IC设计厂商以博通、Marvell为代表,亚马逊、谷歌、微软、Meta等云厂商持续扩大自研ASIC算力芯片。

国内典型的ASIC芯片例如:阿里平头哥含光800推理芯片;百度昆仑系列AI芯片昆仑1/2代(训练+推理;腾讯在AI推理(紫霄)、视频转码(沧海)、智能网卡(智影)均自研专用芯片等。相关布局厂商中还包括澜起科技、全志科技、国科微、淳中科技、山石网科等。

FPGA:提供介于GPU和ASIC之间的灵活解决方案,其可编程性使硬件能够在算法迭代时进行有效优化,同时在开发周期上比ASIC更为短暂。

全球FPGA市场主要被赛灵思(AMD旗下)和Altera(Intel旗下)占据,其次为Lattice和Microsemi。FPGA国产替代属于早期阶段,国内本土主要厂商包括复旦微电子、安路科技、紫光同创、中微亿芯、易灵思等引领FPGA国产替代,相关布局厂商还包括京微齐力、成都华微电子、智多晶、高云半导体等。

03 存储

AI服务器的主要成本构成中,先进算力与存储芯片是AI服务器的关键组成,存储设备占比约15%。

算力的强弱主要是由AI芯片决定,带宽由存储器决定,而存力是限制AI芯片性能的瓶颈之一。

HBM产业链核心环节包括材料、设备、晶片制造、先进封装等。

全球市场格局方面来看,HBM的供应由三星、海力士和美光三大原厂垄断。SK海力士已经确认在2024年启动HBM4的开发工作,并计划在2026年左右实现量产。美光和三星也分别表示将在2025年和2026年推出自己的HBM4产品。

基于HBM在AI发展中的重要性和国内目前的稀缺性,国内掌握DRAM生产工艺和先进封装工艺的各家厂商或通过自研,或通过合作的方式,正积极研发HBM产品。HBM有望成为本土AI算力产业链的重要突破口,上下游各环节厂商如佰维存储、江波龙,德明利、香农芯创、海太半导体、国芯科技、万润科技、通富微电、长电科技、华天科技、晶方科技、甬矽电子等在产业链各细分环节加速布局。

04:AI服务器

AI服务器专为人工智能训练和推理应用而设计,是支撑生成式AI应用的核心基础设施。

当前训练型服务器占比57.33%,主导大模型开发,推理型服务器占比42.67%增速更快,预计未来成为主流。

AI服务器产业链上游为零部件厂商,包括芯片、PCB、电源、散热模组等;中游是AI服务器厂商,整合组装将芯片组装进服务器硬件中,并增加必要的网络、存储设备,形成完整的AI服务器解决方案;下游是各类应用市场,包括互联网企业、云计算企业、数据中心服务商、政府部门、金融机构、医疗领域、电信运营商等。

AI服务器参与厂商众多,主要分为ODM厂商与品牌服务器厂商。

ODM厂商:主要负责将GPU等部件组装为GPU服务器/机柜,在主板设计、供应链整合、制造代工等环节提供溢价。再送至品牌服务器厂商处销售,或者是ODM厂商不通过品牌服务器厂商直接与下游(通常是CSP)客户合作。ODM代表厂商包括鸿海、英业达、广达电脑、纬创资通、工业富联等。

品牌服务器厂商:拥有服务器方案自主设计能力与核心技术专利,通过自主设计服务器整体解决方案提供溢价,与ODM厂商形成了既合作又竞争的关系。代表厂商包括戴尔、HPE、浪潮信息、新华三、宁畅、超聚变、中科曙光、华鲲振宇、神州鲲泰、拓维信息、长江计算、同方股份、联想集团以及宝德等。

液冷服务器

算力密度飙升倒逼散热升级,液冷技术成为解决数据中心高密度算力散热问题的核心方案。

目前两大主流液冷主线技术路线是冷板式液冷和浸没式液冷。

冷板式液冷案:具备更优的散热密度和PUE控制能力,是当前智算中心的标配选择。冷板式液冷系统上游核心零部件覆盖散热、循环、分配三大环节,技术壁垒高且价值量集中。

浸没式液冷:长期更适用于超算中心、AI训练集群和高功耗场景,有望成为未来数据中心散热技术的重要发展方向。

当前在"双碳"战略指引下,液冷技术通过节能增效正加速向算力基础设施渗透。IDC预计,2024-2029年,中国液冷服务器市场年复合增长率将达到46.8%,2029年市场规模将达到162亿美元。

液冷服务器核心环节包括液冷板、管路与接头、CDU(冷却分配单元)、冷却液、液冷泵和冷却塔、干冷器、温控和服务器制造等。除整机厂商外,各零部件环节参与厂商众多,包括英维克、申菱环境、高澜股份、中航光电、川环科技、曙光数创、网宿科技、四方科技、强瑞技术、飞龙、川润股份、依米康等企业都在各细分环节深度布局。

PCB

随着AI服务器持续迭代升级,也持续推动PCB和材料环节量价齐升。

在传统服务器中,PCB主要应用于服务器中主板、CPU板、内存、电源背板、硬盘背板、网卡、Riser卡等核心部分;AI服务器中PCB增加GPU板卡、交换板卡等,AI服务器将为PCB带来新的增量。

05:光通信网络

网络主要实现高速数据传输与低延迟通信。

技术趋势包括高带宽(1.6T/3.2T)、低延迟(RDMA)和无损网络(如RoCEv2)等。

当前光连接传输速率迅速从400G跃升至800G,未来将进一步迈向1.6T和3.2T的速率;另一方面,光模块与XPU的比例正持续扩大。未来对于由一百万个XPU组成的超大规模集群,可能对应一千万个光模块,比例高达1:10。

光芯片:在光通信环节中,光芯片是光模块上游实现光电信号转换的核心部件,直接影响光模块的传输速率和稳定性,其成本占比较高。

低速率产品主要包括2.5G和10G光芯片,已基本实现国产化,代表厂商包括武汉敏芯、中科光芯、光隆科技、光安伦、仕佳光子、源杰科技、中电13所、三安光电等。10G光芯片国内源杰科技市占率领先,长光华芯核心产品包括100mWCWDFB激光器芯片,兼容800G/1.6T等高速率光互联场景。云岭光电、中电13所、中科光芯、武汉敏芯、光迅科技、海信宽带、索尔思、三安光电、仕佳光子等也是核心参与者。

光器件:是封装与集成的基础,TOSA、ROSA、BOSA是光模块的组成部分,成本占比约30%-40%,国产化率较高。BOSA集成TOSA和ROSA功能,主要用于低速率光模块。国内厂商在BOSA领域国产化率较高,天孚通信、太辰光等企业均能提供全系列解决方案。光库科技铌酸锂调制器等产品在高速ROSA领域具有较强实力,其自主研发的AM系列高带宽模拟调制器实现规模化生产率先打破国外垄断。

光模块:光模块每一代技术升级往往伴随技术路径的演化,引导竞争格局变化。LightCounting最新发布的2024年全球光模块TOP10榜单显示,中国厂商已在该领域占据主导地位(占7席)。旭创科技(排名第1)和新易盛(排名第3)将其业务重点聚焦于服务北美云公司,专注于高速以太网光模块这一增长最快的细分市场。HW排名第4,光迅科技、海信宽带、华工正源分列第6至9位,索尔思光电位居第10。

CPO:将光引擎和交换芯片共同封装在一起的光电共封装技术,从而降低信号衰减、降低系统功耗、降低成本和实现高度集成,可用于数据中心和高性能计算。光通信产业链厂商中,联特科技、中际旭创、通宇通讯、中京电子、天孚通信、新易盛、光迅科技、德科立、亨通光电、华工科技、剑桥科技、博创科技、铭普光磁、腾景科技、汇绿生态等多家已经开始布局CPO相关技术研发或业务。

交换机:算力产业链上游实现网络互联的关键设备,通过电/光信号转发实现算力设施多设备间高效通信。中国交换机市场前五厂商份额约为89.7%,华为、新华三(紫光旗下)、锐捷网络、中兴通讯、思科形成高度集中格局。博通于6月初发布自家最新的Tomahawk6102.4T数据中心交换芯片,在前代芯片基础上再次完成容量翻倍。国内盛科通信在商用以太网交换芯片国内排名第一,全球第四,800G芯片小批量交付,51.2Tbps国产芯片打破垄断,市场份额突破8%。

AI大算力需求下,光路交换机(OCS)全光交换带来性能突破。不同于传统交换机,无需做光电转换,可直接进行光路交换,有效降低了通信硬件成本和功耗,在切换速度、插入损耗、回波损耗、耐用性和可靠性等性能方面均有突破。

0 6:AI数据中心供电系统

数据中心供电系统主要提供稳定电力支持,降低能耗。

AI服务器的算力大幅增强,较通用服务器对电源的功率有更高要求,进而带动服务器电源快速发展。

目前AI数据中心供电系统主要分为三级供电:

1)机柜外电源UPS/HVDC

机柜外电源安装在机柜外部,为数据中心或是特定区域内的IT设备提供稳定电能的电源设备。

UPS:主要作用之一是在市电断供情况下为数据中心提供紧急供电,内部电流转化流程为AC-DC-AC,为数据中心提供稳定电流。含有储能装置,以逆变器为主要组成部分的恒压恒频的不间断电源,为设备提供恒压恒频的不间断电源;其响应时间为毫秒级,稍慢但稳定。该环节相关布局厂商包括科华数据、禾望电气、中恒电气、科士达、英威腾、维谛技术等。

新型供电系统HVDC:高压直流电源,是采用直流电进行供电的技术。取消了逆变环节,直接输出240/336V直流电,效率与可靠性更高。当前HVDC方案推进已成主流,国内HVDC主要参与者或布局者包括台达、中恒电气、科华数据、欧陆通、动力源、禾望电气、麦格米特等。

2)备用电源

电池备份单元BBU:作为备用电源系统,通过锂离子电池提供短期供电保障。采用5+1的冗余架构,一组BBS(电池备份系统)包含六个BBU模块和一个PMI监控模块,电池多为18650锂电池。市场格局方面,BBU电池市场当前以日韩主导,国内蔚蓝锂芯、亿纬锂能等厂商在该环节有所布局。

柴发:为数据中心重要备电应急方案,柴油发电机是以柴油为燃料的小型发电设备,能够持续供电,其中发动机是最核心部件,占总造价的80%左右。当前国内头部厂商潍柴重机、玉柴机器等扩产,国内厂商供应份额有望提升。

3)DCDC

DCDC电源模块分为两步,第一步是将48V直流电进一步降压为12V,供芯片周边器件使用,英伟达GB200服务器上使用的是PDB模块,该环节电源主要制造商有MPS、Renesas等;第二步是把12V电压将为0.8/1V,英伟达GB200上则是Biancaboard上面的VRM,该环节主要制造商有MPS。

此外,SOFC可能成为数据中心电源新选择。SOFC配置灵活,适配数据中心需求。不过目前SOFC卡点在于成本高,产业链还不成熟,大规模应用技术可靠性需要验证。产业进展方面,海外发展较快,国内快速追赶,整体技术渗透率极低。该环节主要布局厂商包括三环集团、壹石通和雄韬股份等。

在当前AI产业大趋势下,全球科技巨头正持续加大AI投资,推动产业链各环节迎来新一轮变革机遇。Meta计划到2028年至少在美国投资6000亿美元,用于数据中心和相关基础设施建设。此前,谷歌、Meta、亚马逊就已相继上调2025全年资本开支预期。国内以阿里巴巴和腾讯为代表的互联网巨头在AI领域的投资也在持续增长,目前AI产业大趋势下产业链各环节有望新来新一轮变革机遇。

发布于 北京