拾麦者说
26-04-13 17:04 微博认证:投资内容创作者 情感博主

谷歌×博通×Anthropic 3.5吉瓦TPU集群合作:AI算力格局结构性重构
核心合作概况
谷歌、博通、Anthropic达成深度定制合作,规划建设**3.5吉瓦TPU算力集群**,总投入达百亿美元级别:
- 2026年:部署1吉瓦(40万颗TPU),主打推理场景
- 2027年:部署超2吉瓦,主力芯片切换至**TPU v8**,转向训练业务
此次合作并非简单算力采购,而是AI芯片与数据中心架构的全面定制化,标志着大模型厂商从“租用通用算力”升级为“深度绑定算力战略”。

一、产业格局巨变:英伟达垄断松动,博通成最大赢家
1. **大模型厂商全面转向“多芯片供应商”策略**
- Anthropic当前算力中英伟达占比65%,目标降至50%
- XAI委托博通设计自研芯片(2027年推出),Meta同步采购AMD、英伟达、谷歌三家AI芯片
- 头部厂商通过多供应商布局,打破英伟达垄断、压低算力成本
2. **博通手握三大核心订单,卡位AI芯片定制核心**
同时拿下谷歌TPU定制、亚马逊下一代训练芯片定制(2027下半年量产)、XAI自研芯片定制,成为AI芯片格局重构的核心受益方。
3. **代工链条多元化,摆脱台积电单一依赖**
- 联发科首次为谷歌代工TPU推理芯片:2026年60万颗,2027年突破100万颗
- 2026年TPU主力由台积电代工;2027年谷歌将20%-30%订单转至英特尔EMIB工艺,三星作为备选
- 服务器代工:富士康占70%-80%,剩余由台达承接

二、2027年:AI算力架构真正拐点,存算分离重构数据中心
1. **TPU v8引入CXL内存池化+存算分离**
- 现有TPU采用本地HBM设计,大token推理存在明显内存瓶颈
- TPU v8通过CXL总线接入共享DDR内存池,实现存算分离,谷歌目标2027年数据中心渗透率80%-90%
2. **成本与性能双重优化**
- 单芯片HBM用量减少约30%,整体共享存储容量提升1.5-2倍
- 微软(联发科/Marvell)、亚马逊(联发科)同步推进CXL内存池化,CXL已成数据中心内存架构通用趋势

三、互联方案终局已定:博通Scale-up以太网替代LPO/NPO
1. **LPO/NPO仅为过渡,CPO+Scale-up以太网是终极方向**
博通明确:该方案延迟接近PCIe/NVLink,采用开放协议,适配多厂商芯片混合部署
2. **部署节奏明确**
- 2026年Anthropic OCS互联方案占比60%-80%,但成本比以太网高50%以上
- 2027年起逐步切换至Scale-up以太网,新一代TPU v8已内置以太网接口

四、最大供应链风险:台积电2027年先进封装产能瓶颈
1. **产能严重紧缺**
英伟达已锁定台积电约60%先进封装产能,2027年谷歌TPU需求超600万颗,台积电空闲产能无法满足
2. **替代方案存在不确定性**
谷歌转向英特尔EMIB工艺(性能优于CoWoS),但技术仍在磨合,2027年量产落地存在风险
3. **系统性风险**
所有依赖台积电先进封装的AI芯片厂商均受影响,成为2027年全球AI算力供应链核心隐患

五、三方分工与合作本质
分工
- 博通:TPU定制化设计、芯片间互联架构研发
- 谷歌:提供3.5吉瓦TPU集群、数据中心托管、平台调度优化
- Anthropic:聚焦大模型与Agent研发,硬件全交由合作方部署

核心逻辑
Anthropic从“算力采购方”变为“算力战略合伙人”,放弃部分成本控制权,将全部资源集中于模型研发,不再自建基础设施。

六、关键风险提示
1. 台积电产能超预期紧张+英特尔EMIB量产不顺,将导致TPU供应缺口,拖慢部署节奏
2. Scale-up以太网成熟进度不及预期,LPO/NPO过渡期延长,影响博通互联产品节奏
3. 英伟达推出定制化降本方案,缩小与ASIC成本差距,削弱多供应商替代动力
4. CXL内存池化大规模落地技术延期,存算分离架构变革时间线后移

发布于 北京