最近看到一个很有意思的问题:现在大家到底在用AI干什么?
答案可能会让你意外。一半人在用AI写代码,另一半人在用AI玩角色扮演。听起来像段子,但这是分析了100万亿token真实数据后得出的结论。
这个结论来自OpenRouter最近发布的一份研究报告。OpenRouter是什么?简单说,就是一个AI模型的超市,把ChatGPT、Claude、Gemini、DeepSeek等各种AI模型整合在一个平台上,用户可以随意切换使用。过去一年里,这个平台记录了100万亿个token的使用数据。
100万亿是什么概念?如果平摊给全球所有人,相当于每个地球人都写了一本一万多字的小册子。如果打印成书,大概相当于20个美国国会图书馆的藏书量。
当然,这只是单一平台的数据,不能代表整个AI世界。但这个体量已经足够让我们看到很多有价值的东西了。
洞察一:编程和角色扮演占据半壁江山
报告显示,编程任务的占比从2025年初的11%暴涨到50%以上。同时,角色扮演、写小说、玩游戏等创意类应用在开源模型中的占比也超过50%。
编程任务的爆发反映出程序员的工作方式正在改变。现在的编程任务平均输入长度达到2万个token。什么概念?就是一个前端工程师把整个React项目的组件库、API文档、报错日志都发给AI,让它帮忙排查问题。
AI已经不只是写个函数的简单助手,而是能处理整个代码库的协作者。
角色扮演这边更有意思。用户让AI扮演游戏角色、写互动小说、创造虚拟人物,甚至只是陪自己聊天。这些看似不务正业的用途,消耗的token量和专业编程差不多。
为什么大家喜欢用开源模型玩这些?因为开源模型可控性更强,容易调教出独特风格,而且能跳过很多内容审查,响应速度也更快。
这说明AI的价值不只在提高效率,还在创造新体验。有人用它解决技术问题,有人用它获得情感陪伴,这两个完全不同的场景共同构成了AI的真实生态。
洞察二:中国AI的崛起速度
2024年底,中国开源模型在OpenRouter平台的使用占比只有1.2%,几乎可以忽略不计。但到2025年中期,有些周的占比已经飙升到30%。不到一年时间,从1%增长到30%,这个速度相当惊人。
如果按token使用量排名,在开源模型中,DeepSeek以14.37万亿排全球第一,Qwen以5.59万亿排第二。Meta的LLaMA是3.96万亿,Mistral AI是2.92万亿,OpenAI的开源模型只有1.65万亿。DeepSeek的token使用量几乎是OpenAI开源模型的9倍。
为什么token使用量大能说明模型好用?因为用户愿意把更多、更复杂的任务交给它处理。如果一个AI只便宜但效果差,用户试一次就不会再用。但如果既便宜又好用,用户就会把越来越多工作交给它,token使用量自然上去了。
更重要的是,市场格局也在变化。2024年底,DeepSeek在开源模型里几乎一家独大,占比超50%。但到2025年底,它的占比降到25%以下。这倒不是DeepSeek变差了,而是Qwen、MiniMax、Kimi等新玩家起来了,市场从一家独大变成多元竞争。
对普通用户来说,这意味着我们有了更多选择,不用只盯着一两个模型。
洞察三:灰姑娘的水晶鞋效应
报告里发现了一个很有意思的现象,叫做灰姑娘的水晶鞋效应。什么意思?就是第一个能解决你问题的AI,会对你产生很强的锁定效应。
数据显示,2025年5月Claude Sonnet 4刚发布时的那批早期用户,到了第5个月留存率还有40%。Gemini 2.5 Pro在6月份的早期用户,5个月后留存率也有40%。但那些后来才开始用这些模型的用户,留存率普遍不到10%。
为什么差距这么大?因为当一个AI第一次解决你工作中的关键问题时,你会围绕它建立整套工作流程。它熟悉你的工作习惯、表达方式和思维节奏,换一个新AI就像换双新鞋,需要重新磨合。这时候就算有更好的模型出现,你可能也懒得换了,因为切换成本太高。
这给了我们一个实用建议:选对第一个AI很重要。不要随便找个AI就开始用,最好先多试几个,找到真正适合自己的。因为一旦形成使用习惯,后面再换就很难了。
洞察四:价格不是关键
可能会颠覆很多人的认知:价格和使用量的相关性极弱。10%的价格下降,只能带来0.5%到0.7%的使用增长。
Claude在编程任务上每百万token得花约2美元,但它依然占据编程任务60%以上的市场份额。OpenAI的GPT-5 Pro定价更夸张,每百万token得花35美元,是DeepSeek的100多倍,但用的人依然不少。
这说明用户在选择AI时,更看重能力和可靠性。想想看,如果你是程序员,正在处理关键项目,你会为了省几块钱选一个不靠谱的AI吗?大概率不会。宁愿多花点钱,也要用一个真正能解决问题的工具。
所以选AI别只看价格,免费的不一定最适合你,贵的也不一定就是智商税。
如果你是企业负责人,总喊着为什么员工不用AI,但又不从制度或基建上支持,让同事们能用上最强大最顺手的AI工具,这就是典型的又想马儿跑得快,又想马儿不吃草。
洞察五:使用方式正在改变
过去20个月里,用户发送给AI的平均提示词长度从1500个token涨到6000多个,增长了近4倍。AI的输出内容也从平均150个token涨到400个,增长了近3倍。
这个变化反映了AI角色的转变:从助手到协作者。以前我们用AI,更多是写个文案、翻译一段话这类简单任务。现在不一样了,你可以把整个项目背景、相关合作方的特点、想达成的目标都告诉AI,让它帮你设计完整的沟通策略。
AI不再只是直接回答问题,而是帮你理解、分析、提方案,甚至帮你发现你自己都没注意到的问题。
这种使用方式的改变,带来了一个有意思的现象,叫杰文斯悖论。简单说,就是AI越便宜,大家用得越多,总成本反而更高。因为当你发现AI能处理更长的上下文,你就会给它更多内容,让它做更复杂的任务,结果消耗的token比以前更多。
洞察六:全球格局在变化
报告显示,亚洲用户的支出占比从2025年初的13%飙升到31%,翻了一倍多。同时,北美用户的占比从50%以上首次跌破50%。这是个标志性变化,说明AI使用正从美国主导转向全球共享。
更直观的是语言分布数据。所有AI对话中,英语占82.87%,这不意外。但第二名是简体中文,占4.95%,远超俄语的2.47%和西班牙语的1.43%。
中文能排第二,说明中国用户的使用量确实很大。而且我相信英文对话中,也有大量对话是中国用户产生的,毕竟编程等场景下,用英文表达有时更准确。
这个趋势意味着什么?最直接的影响是,AI产品会越来越重视中文市场。以前很多AI工具都是英文优先,中文支持总是慢半拍。现在不一样了,当中文用户占比越来越高时,AI公司不可能再忽视这个市场。所以我们能看到,越来越多AI产品开始重视中文体验,甚至专门为中文用户优化功能。
写在最后
看完这份报告,最大的感受是:AI的使用方式远比我们想象的多元。
一半人写代码,另一半人玩角色扮演,这两个看似完全不搭边的场景,证明了AI既是生产力工具,也是创意伙伴。中国开源模型使用占比从1%到30%的逆袭,证明了技术竞争格局正在重塑。而水晶鞋效应提醒我们,选对第一个AI,可能比想象中更重要。
AI的竞争格局还在快速变化,今天的第一名,明天可能就被超越。但对我们来说,这是好事。竞争越激烈,我们能用到的工具就越好,选择也越多。
所以别焦虑,好好享受这个AI工具层出不穷的时代。
#科技先锋官##AI创造营##微博兴趣创作计划#
