但斌
26-05-09 15:30 微博认证:深圳东方港湾投资管理股份有限公司董事长

转:Harry Archerman :“你怎么看这个说法:受AI工作负载影响,CPU与GPU的配比已从1:4~1:8转变为如今的1:2。未来智能体AI工作负载对CPU的需求可能会进一步提升,CPU写GPU配比或将升至2:1、4:1,甚至高达10:1。”

groks:这个说法整体上非常准确,基本符合2026年当前行业主流观点和最新财报/分析机构的共识。 它捕捉到了AI算力架构从“GPU主导”向“CPU-GPU协同均衡”转变的核心趋势,尤其在**智能体AI(Agentic AI)**兴起后,CPU的重要性被显著重估。01
当前配比变化:从1:4~1:8 → 1:2(或已到1:4,正在向1:2/1:1收紧)
• 传统AI(主要是训练+简单聊天机器人推理):CPU主要负责数据预处理、调度和I/O,GPU承担重度并行计算。一个CPU通常能带48个GPU(即CPU:GPU = 1:41:8)。这是过去几年数据中心的主流配置。
• 现在(2026年):随着AI工作负载从训练转向推理,尤其是大规模在线推理,CPU需求明显增加。Intel在2026 Q1财报电话会上明确表示,CPU:GPU配比已从1:8收紧至约1:4;AMD、TrendForce等也指出当前已向1:2~1:1方向演进。715
• 原因很简单:推理阶段需要实时调度、KV Cache管理、批处理、请求路由等,CPU负载变重;否则GPU会“饿死”(利用率下降),浪费昂贵的GPU资源。
多家公司和分析师(Intel、AMD、Evercore ISI、TrendForce)都认可这个转变已经发生,不是预测,而是正在发生的现实。3
未来智能体AI:CPU需求进一步提升,配比可能到2:1、4:1甚至更高
完全合理,甚至可能更激进。 智能体AI不是简单的“问答”,而是“思考-规划-调用工具-多代理协作-执行-反馈”的复杂循环。这里面大量工作(编排、策略执行、安全检查、工具调用、内存管理、强化学习等)高度依赖CPU的通用计算和低延迟调度,而不是GPU的并行矩阵运算。12
• AMD(Lisa Su):智能体AI让CPU:GPU配比从传统1:4/1:8向1:1甚至CPU更多演进。35
• Intel:可能趋近1:1,甚至进一步向CPU倾斜。8
• 分析师观点:Evercore ISI提到最快增长的工作负载可能把配比从1:8翻转到8:1;TrendForce等预测智能体时代每GW算力所需CPU核心数将从3000万暴增至1.2亿(4倍增长)。027
10:1虽然是极端情况,但方向上没错——部分纯编排或多代理场景可能出现CPU主导,甚至出现“CPU-only”子任务集群。
我的看法总结
这个说法不是夸大,而是对行业正在发生的结构性转变的精准概括。它解释了为什么2026年服务器CPU(尤其是Intel Xeon、AMD EPYC)供不应求、价格上涨、交期拉长,同时也预示了CPU厂商的“文艺复兴”。GPU依然关键(尤其是推理加速),但CPU不再是“配角”。
当然,实际配比会因具体场景(简单聊天 vs. 复杂多代理 vs. 企业内部工具调用)而异,不是所有数据中心都会立刻变成10:1,但整体趋势已不可逆。对投资者、云厂商、硬件厂商来说,这意味着算力采购预算要重新分配,不能只盯着GPU。

发布于 美国