千问登顶开源模型榜首

我这两天刷到Hugging Face更新了一组数据，在开源模型下载量这个榜单上，中国模型居然登顶了。

千问，全球第一。

下载量已经突破10亿次，平均每天被下载110万次。

这也意味着千问已经完全超越了美国的Llama，稳居开源大模型全球第一。

在聊这个数据之前，先跟大家简单聊一下为什么Hugging Face下载量这个指标很重要。

因为这相当于全球开发者真金白银的投票，你愿意花时间下载一个模型，愿意花精力部署、调试、跑通，说明你是真的觉得它好用。

下载量可以说是评判开源模型实际应用落地的核心指标。

但是，为什么还要看衍生模型数量？

这里需要解释一下开源生态的一个逻辑：下载量说明有人在用，但衍生模型数量说明有人在基于它创造新东西。

你下载一个模型，可能只是拿来跑个demo试试。

但如果你基于它做二次开发，训练出一个新模型，还把这个新模型也开源出去，这说明你是真的认可它的底层能力。

这种二次开发会形成滚雪球效应，好的基座模型吸引开发者，开发者做出衍生模型，衍生模型又吸引更多人关注原模型。

生态就是这么滚起来的。

Hugging Face的数据显示，基于千问的衍生模型已经突破20万个。
全球第一个达成这个里程碑的开源大模型。每天还在以超过200个的速度新增。

这些衍生模型涵盖机器人控制、代码生成、漫画后期制作、多语种翻译等方向。

比如最近开发者圈子里很火的一个多角度相机控制工具，就是基于千问的图像编辑模型再训练出来的。

再说回千问超越Llama。

过去几年，Llama一直是开源界的老大。
Meta在这个领域投入了大量资源，全球开发者也习惯了以Llama为基座做开发。

但现在，风向变了。

MIT和Hugging Face联合做过一项研究，分析了全球22亿次模型下载行为。
结论是中国开源AI模型的采用份额已经达到17.1%，首次超过美国的15.8%。

这个超越不是小事。
过去几年，中国在AI领域一直被认为是追赶者。
现在至少在开源这条赛道上，角色正在发生变化。

说回具体的使用场景。
光有下载量还不够，关键是谁在用、用来干什么。

斯坦福李飞飞团队基于千问训练出了新模型s1，进一步拓展了开源社区对AI推理的探索。

美国艾伦AI研究所把千问视为AI社区探索强化学习新技术的事实基座模型。

再来看商业落地，技术好只是第一步，能不能转化成实际价值才是关键。
在国内，千问已经被嵌入了手机、音箱、眼镜等各种智能设备。

好用加上免费，让它成为最受企业欢迎的开源模型。

海外的表现更有说服力，亚马逊和爱彼迎这些硅谷公司都在用千问模型训练机器人、发展新业务。

新加坡国家AI计划本来打算用Meta的模型，后来改选了千问。

原因很简单，千问3支持119种语言和方言，不像此前欧美的主流大模型（比如 Llama等），对东南亚小语种支持薄弱。
在千问3基础上训练出的新模型，在东南亚语言上的表现特别好。

缅甸语、菲律宾语、印尼语、马来语、泰米尔语、泰语、越南语，这七种语言的权威评测里，Qwen-SEA-LION-v4达到当前开源模型最佳水平。

一个中国模型被东南亚国家选中做国家级AI项目的底座，这在几年前是不可想象的事情。

业内大佬是怎么看这件事的？
Google DeepMind的CEO哈萨比斯接受CNBC采访时说，中国AI模型和美国的差距可能只有几个月。

这话从哈萨比斯嘴里说出来，分量很重。
他是AlphaGo的缔造者，也是全球AI领域最顶尖的科学家之一。

英伟达CEO黄仁勋在财报电话会上也提过，阿里巴巴的千问大模型是开源AI模型之中最好的。

所以，开源为什么重要？
因为它决定了AI技术最终会以什么方式普及。

如果开源模型够好，中小企业和个人开发者就能低成本地使用AI能力，创新的门槛会大幅降低。

反过来，如果只有闭源模型能打，AI就会变成少数大公司的专属工具。

从这个角度看，中国开源模型的崛起不只是一场商业竞争的胜利，它是让AI技术惠及更多人的一个重要推动力。

当全球的开发者都在用中国的开源模型时，中国AI的影响力就不仅仅体现在下载量上了。
它会渗透到各种产品、各种应用、各种创新当中，成为全球数字经济基础设施的一部分。

这才是10亿次下载真正的意义。

发布于上海