OpenAI发布Jalapeño芯片

#赛博茶馆[超话]#OpenAI 昨天发布了一款叫 Jalapeño 的芯片，跟 Broadcom 合作的，专门做大语言模型推理。这个名字起得挺有意思，辣椒嘛，辣在哪？辣在它直接冲着 Nvidia 的饭碗去。

先说几个关键数字。推理成本砍半，约 50%。从开始设计到流片只花了 9 个月，半导体行业正常周期是按年算的。OpenAI 自己的模型参与了芯片设计加速，用 AI 设计 AI 要跑的芯片，闭环了。

为什么 OpenAI 要自己造芯片？核心原因就一个字：钱。OpenAI 2025 年营收 130 亿美元，听着很多，但运营支出 340 亿，亏损近 210 亿。其中研发和基础设施花了 192 亿，光付给 Microsoft 的算力费就超过 105 亿。推理虽然不是最大的开支项，但它是持续性的、随用户增长线性放大的那种成本。训练是一次性的大投入，推理是每天都在烧的钱。

Jalapeño 是 ASIC 架构，跟 GPU 的区别很简单：GPU 是万能选手什么都能跑，ASIC 是专项冠军只跑一类活。你为通用性付出的代价就是效率和成本。OpenAI 的判断是，LLM 推理这个场景已经足够大、足够标准化，值得专门做一颗芯片。Google 有 TPU，Amazon 有 Trainium，现在 OpenAI 有 Jalapeño，逻辑一样。

几个值得深想的点：

第一，软件和硬件一起做。OpenAI 说他们是从零开始设计的，不是拿一个通用加速器改改。架构上针对 LLM serving 优化，减少不必要的数据搬运，让计算、内存、网络三者的配比更匹配实际负载。这种软硬件协同设计是 Apple 在 iPhone 上玩了很多年的套路，现在 AI 公司也开始走这条路。

第二，用 AI 加速芯片设计。9 个月从草图到流片，这在传统半导体行业几乎不可能。OpenAI 说他们用了自家的前期模型来加速设计流程的某些环节。虽然没说具体用了哪些模型、加速了哪些步骤，但这个方向本身就有标志性意义。芯片设计是高度专业化的工程任务，如果 AI 能在这个领域实质性地提速，那其他工程领域的加速也只是时间问题。

第三，对 Nvidia 的影响。短期内影响有限，因为训练还得靠 GPU，Jalapeño 只做推理。但长期看，如果推理这个场景被 ASIC 吃掉一大块，Nvidia 的增长故事就得打折。而且 OpenAI 同时拿了 Nvidia 的投资，又是 Nvidia 的大客户，又自己做芯片替代 Nvidia 的产品，这种关系挺微妙的。

第四，IPO 的铺垫。OpenAI 2026 年要上市，投资者最关心的问题就是什么时候能盈利。营收在涨但亏损更大，核心成本是算力。如果 Jalapeño 能把推理成本砍半，那每多一个用户、每多一次 API 调用，边际成本就低一截。这个故事讲给华尔街听很好听：我们不只做最好的模型，我们还自己做芯片把成本打下来。

第五，行业趋势。Google、Amazon、Microsoft（通过 Intel 和 AMD 的定制芯片）都在走自研路线。AI 算力正在从买 GPU 变成造专用芯片。这个趋势对 Nvidia 不利，对 Broadcom 这种帮忙造芯片的有利，对整个半导体供应链的影响才刚开始。

最后说一个可能被忽略的细节：OpenAI 说 Jalapeño 是为当前和未来的 LLM 设计的，不只是给自己的模型用，理论上也能卖给别的 AI 公司。如果真走这条路，那 OpenAI 就不只是 AI 模型公司，还是 AI 芯片公司。这个定位变化比芯片本身更值得关注。

造芯片这件事，表面看是省钱，深层看是 AI 公司正在从纯软件玩家变成全栈公司。模型、产品、数据中心、芯片，全自己做。这种垂直整合在科技行业出现过很多次，每次都意味着行业格局的重塑。OpenAI 这次迈出的这一步，可能比很多人想象的要大。

#赛博茶馆# #硅基哲学# #OpenAI自研芯片#

发布于上海