算力租赁的“下一站”:Token运营
1.1Token“通胀”再度验证:算力租赁价格端仍具有上行趋势
在2027财年第一财季财报电话会上,英伟达首席财务官科莱特·克雷斯(Colette Kress)表示,随着AI工厂的建设正在加速推进,英伟达的基础设施价值也在不断攀升。今年以来,H100芯片的租赁价格已上涨20%,而A100芯片的云端定价涨幅接近15%。她指出,在公司GPU的折旧年限外,客户依然能产生盈利性收入。
由于对AI GPU的需求持续高涨,Nebius近日宣布H100 GPU的按需租赁价格将从每小时2.95美元上涨至每小时3.85美元。
年初以来我们持续强调Token“通胀”:AI Agent时代Token需求的非线性增长,或直接带来超预期的AI算力需求,国内头部云厂商开始涨价,是需求端景气度持续提升的体现之一。根据人民日报的报道,国内日均Token调用量,从2024年初的1000亿,到2025年底的100万亿,到2026年3月已经达到140万亿。同时,政策大力支持词元发展。国家数据局近日发布公告,就《关于推进行业高质量数据集建设行动的实施方案(征求意见稿)》向社会公开征求意见,在创新行业高质量数据集商业模式方面,方案提出,推动商业模式从基础数据包销售向应用程序接口(API)调用、模型化解决方案及全栈服务梯次跃升。探索词元交易等新型数据集交易模式,构建以词元为基础,可量化、可定价的数据集价值体系。
国内头部云厂商也出现“涨价潮”:今年3月以来,阿里云多次发布涨价通知:1)3月18日,阿里云发布AI算力、存储等产品调价的公告,将于2026年4月18日起对AI算力、CPFS(智算版)等服务价格进行调整。2)4月13日,阿里云发布公告,大数据开发治理平台DataWorks调整标准版、专业版用户的API免费额度并支持按量付费。3)4月15日,阿里云发布DDoS防护产品调价公告,为统一产品定价规范,决定于2026年7月15日起对DDoS原生防护2.0(包年包月)、DDoS高防(中国内地)以及DDoS高防(非中国内地)商品的弹性95功能进行价格调整。当天,阿里云还发布了部分模型单元服务涨价通知,将对部分 MU(Model Unit)模型单元的服务价格进行适度调整。
腾讯、百度等云厂商也宣布开始涨价。1)腾讯:腾讯云于2026年5月9日起对AI算力相关产品服务、容器服务TKE-原生节点相关产品服务、弹性MapReduce(EMR)相关产品服务价格均上调5%,覆盖云服务器CVM-GPU计算型、高性能计算集群GPU型、高性能计算平台THPC工作空间等相关规格全地域、全计费模式。2)百度:百度智能云于2026年4月18日00:00起对AI算力相关产品服务价格上调约5%-30%,并行文件存储等产品价格上调30%,生效时间前已购买的相关产品服务当前计费周期内价格不受影响,新价格将在后续续费周期生效。百度千帆Coding Plan首购优惠活动库存已全部售罄,暂无库存供应,同时自2026年3月13日00:00起对白天高峰时段部分模型的调用进行限流处理,期间部分模型可能出现响应速度变慢、调用排队甚至失败情况,建议切换其他可用模型或错峰使用。
1.2算力租赁的“下一站”:Token运营实现更高价值
Token运营成为算力租赁的“下一站”的核心逻辑:1)供给端:通过Token化运营可以将不同架构、不同厂商、不同节点的异构算力统一转化为标准化的Token供给,无需用户关心底层算力硬件型号、集群部署位置等细节,只需按需购买对应数量的Token即可调用适配的大模型服务,能大幅降低用户用算门槛,同时通过动态调度提升算力资源利用率。2)商业价值:Token运营将算力租赁的商业模式从“一次性卖硬件资源”升级为“持续运营智能服务”,不仅可以通过算力-模型的智能匹配降低用户单位需求的Token消耗,还可以延伸出分层定价、套餐订阅等多元盈利模式,把原来的一次性算力收入转化为高粘性的持续运营收入。3)产业趋势:当前行业已经从前期的算力基础设施建设阶段转向算力高效调度运营阶段,Token作为AI价值流转的核心载体,逐步成为行业内较普遍认可的统一标准,算力租赁企业向下延伸Token运营服务,既能充分盘活已有算力资源的变现潜力,也能对接快速增长的AI推理、训练需求,有望成为行业发展的重要方向。
政策端双红利加持叠加需求端增长,Token运营有望进入快速发展阶段。1)国家将算力网纳入与水网、新型电网、通信网、城市地下管网、物流网并列的“六张网”重点规划,据国家发改委测算,今年”六张网“及相关领域的投资规模将超过7万亿元;工信部、国家数据局同步启动“模数共振”行动,明确支持Token技术赋能钢铁、工业母机等20个重点工业行业。2)截至2026年3月我国日均Token调用量达140万亿,较2024年初增长超千倍,以OpenClaw为代表的智能体应用推动了Token消耗量的数十倍增长。
三大运营商已完成智算底座布局,成为Token产业核心参与者。1)中国电信:明确“All in Token”战略,发布Token套餐以及三大运营商首个百亿级Token工厂集采(不含税规模约164.51亿元),智算总规模91EFLOPS,八大枢纽互访时延 < 12毫秒;2)中国移动:以算力基建为核心,发布Token运营生态体系+应用生态联盟,承诺开放万亿级Token体验包;3)中国联通:主打“Agent+Token+AI云”模式,智算规模45EFLOPS,建成7个百兆瓦级AIDC园区。
Token运营本质上不是算力的二次销售,而是实现价值的升级,其利润空间长期看有望持续扩大。以DeepSeek-V4为例,其价格有望在国产算力进步后同步下降,因此单纯的算力售卖空间长期看可能有限。Token运营更接近于“行业数据积累-大模型训练优化-高质量Token输出-用户反馈迭代”的闭环竞争,掌握重要数据集、能够稳定生产低幻觉、高专业价值Token的厂商,有望建立自身壁垒,进而提升长期利润空间。
因此,Token运营的本质是打造智能交易媒介,将AI产业链从“算力资源买卖”升级为“智能服务交易”。运营商等Token运营的核心参与者的优势是“融合连接”:中国电信Token套餐覆盖自研星辰大模型、DeepSeek、GLM等国内主流大模型;同时,运营商联合上下游厂商构建开放Token生态,覆盖产业链各环节共同做大市场。
1.3投资建议
Token运营本质是AI时代将非标的智能服务转化为标准化、可交易的效用商品的核心基础设施,将产业从过去的"卖算力资源"、"卖模型API"等形式,升级为"按智能效用计价",有助于算力提供商、模型厂商、应用开发商、终端厂商能在统一的价值度量框架下协同分润,而Token运营方的价值体现为资源整合等能力,长期看其价值量有望较租赁形式有进一步提升,因此有望成为算力租赁的“下一站”。
建议关注:1)算力租赁:宏景科技、协创数据等;2)大模型:智谱、MiniMax等;3)国产算力:寒武纪、浪潮信息等。
