为什么 AI大厂开始卖Token了?
OpenAI 在卖,Anthropic 在卖,Google 在卖,国内的字节、阿里、百度也在卖。这些曾经烧钱如流水的 AI 巨头,突然之间都变成了 Token 批发商。这到底是怎么回事?
今天我们就聊一聊 AI 大厂卖 Token 这件事,背后到底藏着什么逻辑。
1、先搞清楚一个基本概念:Token 是什么?
简单理解,Token 就是 AI 模型处理信息的最小单位。你跟 ChatGPT 说一句话,它要先把你的话拆成一个个 Token 来理解,然后再一个个 Token 地生成回复。每一次对话,每一次生成,都在消耗 Token。
你可以把 Token 想象成 AI 世界里的“电”。你用多少电,交多少电费。AI 大厂卖 Token,本质上就是在卖 AI 的“电力”。
2、Agent 来了,Token 消耗量炸了
过去我们用 AI,基本就是一问一答。你问它一个问题,它回你一段话,一次对话消耗几百到几千个 Token,很克制。
但 2026 年春节前后,事情发生了质变。以 OpenClaw 为代表的 AI Agent 火遍全球,AI 从一个“回答问题的助手”变成了“自己干活的员工”。它能自己拆解任务,自己调用工具,自己检查结果,发现不对还能自己纠错重来。整个过程不需要人盯着,7 天 24 小时连轴转。
这意味着什么?意味着 Token 的消耗量从“人说一句,机器说一句”变成了“机器自己跟自己说个不停”。一次复杂任务跑下来,可能烧掉几十万甚至上百万个 Token。
想想看,过去你一天跟 AI 聊几轮,消耗几千 Token。现在一个 Agent 自己跑一圈任务,就能吃掉上百万。这个量级的变化,是十倍、百倍级别的。
说白了,AI 变得越能干,Token 就烧得越快。这跟我们日常生活中的道理是一样的:工具越强大,能源消耗就越大。汽车比自行车快,但也比自行车费油。AI Agent 比聊天机器人强大得多,Token 消耗自然也不在一个量级。
3、包月模式扛不住了,必须按量收费
很多人可能会问,AI 公司不是都有包月套餐吗?ChatGPT Plus 每月 20 美元,Claude Pro 也差不多,为什么还要单独卖 Token?
原因很简单:亏钱,亏大钱。
传统的软件公司,比如做办公软件、做协作工具的,毛利率能到 70% 到 90%。你交了月费,公司的服务器成本其实很低,大部分钱都是利润。但 AI 公司完全不一样,AI-first 产品的毛利率只有 20% 到 60%。每一次你跟 AI 对话,后面都有 GPU 在疯狂运转,都在烧真金白银。
GitHub Copilot 刚上线的时候,据说每个付费用户都在让微软亏钱。OpenAI 更夸张,2025 年收入超过 130 亿美元,听起来很多对吧?但光算力成本就烧掉了 80 亿美元,预计到 2026 年底累计亏损 140 亿美元。
所以 Anthropic 在 2026 年 1 月推出 Agent 功能的时候,做了一个很精明的决定:把重度用户往更贵的套餐或者 API 按量计费上引导。OpenAI 也在 2025 年中期给不到 5% 的重度用户加了周使用量限制。意思很明确:你要是把 20 美元的月卡当无限量自助餐吃,那对不起,我们得给你换个计费方式。
行业调查也印证了这一点,68% 的科技公司高管认为传统的定价模式根本撑不起 AI 产品的商业化。
这其实给我们提了一个醒。我们平时用各种 AI 工具,觉得包月很划算,甚至觉得免费的就够用了。但天下没有免费的午餐,AI 公司现阶段的低价策略更多是在抢市场,长远来看,按量付费一定是大趋势。就像打车软件刚出来的时候疯狂补贴,等市场格局稳定了,价格自然就回归了。趁现在各家还在打价格战,多学多用多积累,可能是最聪明的选择。
4、中国的独特优势,5 毛钱的电变成 11 块钱的智能服务
如果说全球 AI 大厂卖 Token 是商业模式的必然,那中国大厂卖 Token 还多了一层更深的战略意义。
2026 年 2 月,全球最大的 AI 模型 API 聚合平台 OpenRouter 发布了一组数据:中国 AI 模型的全球周调用量达到 4.12 万亿 Token,首次超越美国的 2.94 万亿 Token。全球调用量前五的模型里,中国占了四个席位。
这个数据背后有一个非常精妙的经济学逻辑。
中国西部有大量的风电和光伏资源,发出来的绿色电力非常便宜,大概 5 毛钱一度。但过去这些电受限于物理电网,很难远距离输送,只能在当地消化,增值空间很有限。
现在不一样了。把算力中心直接建在这些能源富集的地方,便宜的电就地驱动 GPU 运转,生成海量的 Token,再通过一根光纤卖给全世界的开发者。5 毛钱一度的电,摇身一变成了价值 11 块钱的智能服务。
这就好比过去你只能把矿石低价卖出去,现在你在矿山旁边建了加工厂,把矿石炼成高端产品再卖,附加值一下子就上去了。而且这个“加工厂”不需要修公路、不需要跑货车,一根网线就能把产品送到全世界。
这种模式让中国 AI 厂商在全球市场上拥有了天然的成本优势。当美国公司还在为高昂的电费和算力成本发愁的时候,中国公司已经靠着便宜的能源把 Token 的生产成本压到了极低的水平。
5、Token 正在成为 AI 时代的水电煤
把上面这些线索串起来,一条清晰的逻辑链就浮现了。
Agent 时代来了,Token 消耗量暴增,需求端出现了爆发式增长。固定月费的订阅模式覆盖不了成本,按量计费成为必然选择。中国凭借能源和算力的成本优势,把 Token 变成了可以出口的商品。全球开发者生态日趋成熟,API 市场上有了大量的买家。
供需两端同时发力,Token 自然就成了 AI 时代最核心的交易标的。
回头想想,每一个技术时代都有自己的基础计量单位。工业时代是电力,按度计费。互联网时代是带宽,按流量计费。到了 AI 时代,这个基础单位就是 Token。
谁能以最低的成本、最大的规模、最稳定的质量供给 Token,谁就掌握了这个时代的定价权。这跟当年的石油逻辑如出一辙:不是谁的油品质最好谁说了算,是谁的产量最大、成本最低、供应最稳谁说了算。
6、最后说几句
我最大的感受是:AI 行业正在从一个“讲故事”的阶段,快速进入“算账”的阶段。
过去几年,大家比的是谁的模型参数多,谁的跑分高,谁的发布会更炫酷。但从 2026 年开始,竞争的核心维度变了,变成了谁能更便宜、更稳定、更大规模地供给 Token。这是一场基础设施层面的较量,拼的是能源、算力、工程化能力这些硬实力。
对于我们普通人来说,理解 Token 经济学可能比追逐最新的 AI 模型更重要。因为 Token 的价格直接决定了未来 AI 服务的成本。Token 越便宜,AI 就越能渗透到日常生活的方方面面。反过来,如果 Token 价格居高不下,很多看起来很美好的 AI 应用场景可能就只是空中楼阁。
时代的齿轮已经转动了。AI 大厂卖 Token,看似只是一个商业模式的调整,实际上标志着整个行业从“技术竞赛”走向“资源竞赛”的拐点。而在这场新的竞赛中,中国手里握着的牌,可能比很多人想象的要好得多。
#为什么AI大厂开始卖Token##How I AI##科技先锋官#
