晚点LatePost 26-03-25 09:58
微博认证:晚点LatePost 官方微博

#火山引擎日均token调用量破100万亿#【晚点独家丨#火山引擎云端大模型日均调用量破百万亿Tokens#,AI 云竞争日趋激烈】《晚点 LatePost》独家获悉,自今年春节以来,字节跳动云计算业务火山引擎的日均云端大模型调用量已超过 100 万亿 Tokens(词元),不到两个月上涨了超 60%。来自个人用户的 Token 消耗近期也明显增长。

据了解,全球目前只有三家公司的 Token 消耗量超过 100 万亿,分别是 OpenAI、Google 与字节跳动。不过字节跳动的 Token 消耗主要来自中国市场,海外市场则在快速增长阶段。

一位火山引擎人士告诉我们,火山目前的增长还是在一定约束条件下实现的——字节跳动旗下的视频生成模型 Seedance 2.0 API 尚未在海外正式上线。

Token 是 AI 理解和生成文本的最小语义处理单元,使用者每一次与大模型的交互(提问、生成的代码、生成的图片和视频等),最终都要被拆解成 Token 来完成运算。因此 Token 调用量成为了衡量 AI 模型活跃度、AI 企业算力承载力的关键指标。

过去一年里,Claude Code 等编程智能体(Agent)产品的走红让许多科技公司进一步意识到了 Token 的重要性——一次智能体任务往往包含多轮推理、工具调用和任务执行,Token 消耗通常显著高于普通 AI 对话。OpenClaw 则将 Agent 推向了更广泛的大众用户,进一步放大了 Token 的价值。

当地时间 3 月 16 日,英伟达创始人兼 CEO 黄仁勋在英伟达 GPU 技术大会(NVIDIA GTC)上称,Token 将是未来数字世界最核心、最值钱的大宗商品;Token 的相关指标(吞吐量、生成速度)将成为全球企业 CEO 追踪的核心经营数据,它的表现会直接反映在企业后续的收入中。

提供 MaaS(模型即服务)业务的云厂商是这一轮 Token 大爆发最大的受益者之一。它们通过出售模型调用服务、推理能力和配套工具获利;市场对 Token 需求的激增会直接推高它们的模型调用量,并带动收入增长。

2025 年起,围绕 Token 的 AI 云战争已经打响。亚马逊 AWS 管理层在 10 月的财报电话会议披露,长远来看,MaaS 的收入贡献将与 EC2(亚马逊 AWS 的 CPU 和 GPU 计算实例业务,总营收占比超过 30%)不相上下。

阿里云则在 11 月末启动了 “百炼战役”,目标是短期内将百炼(阿里云的 MaaS 平台)Token 调用规模提升三倍以上。今年 3 月 16 日,阿里巴巴成立了 Alibaba Token Hub 事业群,由集团 CEO 吴泳铭直接带队。

阿里云智能集团资深副总裁、公共云事业部总裁刘伟光在接受我们的访谈时曾提到,过去取得了什么成绩并不重要,下一年增量的 10% 都会大于上一年的全量。2026 年,阿里云的目标是拿下中国 AI 云市场增量的 80%。

《晚点 LatePost》独家了解到,火山引擎此前曾定下了 2026 年 MaaS 业务收入超百亿元的目标,随着 Seed 2.0、Seedance 2.0 等模型发布、OpenClaw 持续爆火,团队已提升了收入目标。就在上一年,火山引擎也曾因这块业务增长迅猛,两度上调收入目标。 http://t.cn/AXf38rOE

发布于 北京