#赛博茶馆[超话]#OpenAI 昨天发布了一款叫 Jalapeño 的芯片,跟 Broadcom 合作的,专门做大语言模型推理。这个名字起得挺有意思,辣椒嘛,辣在哪?辣在它直接冲着 Nvidia 的饭碗去。
先说几个关键数字。推理成本砍半,约 50%。从开始设计到流片只花了 9 个月,半导体行业正常周期是按年算的。OpenAI 自己的模型参与了芯片设计加速,用 AI 设计 AI 要跑的芯片,闭环了。
为什么 OpenAI 要自己造芯片?核心原因就一个字:钱。OpenAI 2025 年营收 130 亿美元,听着很多,但运营支出 340 亿,亏损近 210 亿。其中研发和基础设施花了 192 亿,光付给 Microsoft 的算力费就超过 105 亿。推理虽然不是最大的开支项,但它是持续性的、随用户增长线性放大的那种成本。训练是一次性的大投入,推理是每天都在烧的钱。
Jalapeño 是 ASIC 架构,跟 GPU 的区别很简单:GPU 是万能选手什么都能跑,ASIC 是专项冠军只跑一类活。你为通用性付出的代价就是效率和成本。OpenAI 的判断是,LLM 推理这个场景已经足够大、足够标准化,值得专门做一颗芯片。Google 有 TPU,Amazon 有 Trainium,现在 OpenAI 有 Jalapeño,逻辑一样。
几个值得深想的点:
第一,软件和硬件一起做。OpenAI 说他们是从零开始设计的,不是拿一个通用加速器改改。架构上针对 LLM serving 优化,减少不必要的数据搬运,让计算、内存、网络三者的配比更匹配实际负载。这种软硬件协同设计是 Apple 在 iPhone 上玩了很多年的套路,现在 AI 公司也开始走这条路。
第二,用 AI 加速芯片设计。9 个月从草图到流片,这在传统半导体行业几乎不可能。OpenAI 说他们用了自家的前期模型来加速设计流程的某些环节。虽然没说具体用了哪些模型、加速了哪些步骤,但这个方向本身就有标志性意义。芯片设计是高度专业化的工程任务,如果 AI 能在这个领域实质性地提速,那其他工程领域的加速也只是时间问题。
第三,对 Nvidia 的影响。短期内影响有限,因为训练还得靠 GPU,Jalapeño 只做推理。但长期看,如果推理这个场景被 ASIC 吃掉一大块,Nvidia 的增长故事就得打折。而且 OpenAI 同时拿了 Nvidia 的投资,又是 Nvidia 的大客户,又自己做芯片替代 Nvidia 的产品,这种关系挺微妙的。
第四,IPO 的铺垫。OpenAI 2026 年要上市,投资者最关心的问题就是什么时候能盈利。营收在涨但亏损更大,核心成本是算力。如果 Jalapeño 能把推理成本砍半,那每多一个用户、每多一次 API 调用,边际成本就低一截。这个故事讲给华尔街听很好听:我们不只做最好的模型,我们还自己做芯片把成本打下来。
第五,行业趋势。Google、Amazon、Microsoft(通过 Intel 和 AMD 的定制芯片)都在走自研路线。AI 算力正在从买 GPU 变成造专用芯片。这个趋势对 Nvidia 不利,对 Broadcom 这种帮忙造芯片的有利,对整个半导体供应链的影响才刚开始。
最后说一个可能被忽略的细节:OpenAI 说 Jalapeño 是为当前和未来的 LLM 设计的,不只是给自己的模型用,理论上也能卖给别的 AI 公司。如果真走这条路,那 OpenAI 就不只是 AI 模型公司,还是 AI 芯片公司。这个定位变化比芯片本身更值得关注。
造芯片这件事,表面看是省钱,深层看是 AI 公司正在从纯软件玩家变成全栈公司。模型、产品、数据中心、芯片,全自己做。这种垂直整合在科技行业出现过很多次,每次都意味着行业格局的重塑。OpenAI 这次迈出的这一步,可能比很多人想象的要大。
#赛博茶馆# #硅基哲学# #OpenAI自研芯片#
发布于 上海
