麻省理工科技评论 26-03-13 19:03
微博认证:《麻省理工科技评论》杂志官方微博

【RISC之父向AI芯片泼冷水:AI推理不需要更强的GPU,需要另一种硬件】

近日,2017 年#图灵奖# 得主、被称为“RISC 之父”的 David Patterson 最近与 Google DeepMind 高级工程师马晓宇在 IEEE Computer 联合发表了一篇论文——“关于大语言模型推理硬件的挑战与研究方向”,引发了科技圈的关注与讨论。

David Patterson,这位 RISC 架构的奠基人、影响了全球 99% 微处理器设计的计算机科学家,在论文开篇就抛出了一个尖锐的判断:当前 AI 芯片的设计思路,即满载的算力、堆叠的 HBM(High Bandwidth Memory,高带宽内存)、带宽优先的互联,与大语言模型推理的实际需求严重错配。

在某种程度上,这可以说是对整个 #AI芯片# 产业的当头棒喝。Patterson 在文中直言,LLM 推理正处于危机之中,不是技术上的危机,而是经济上的。因为,越来越多的公司们发现,即便拥有最先进的 #GPU# 集群,为最先进的模型提供推理服务依然在大把烧钱。

根据多家媒体报道,微软、亚马逊、谷歌、Meta 四大科技巨头在 2026 年 AI 相关资本总开支预计达到约 6,000 亿美元。这一规模相比 2025 年约 3,880 亿美元,增长约 50% 以上。

戳链接查看详情:http://t.cn/AXVExcxf