西里森森 26-01-21 16:46
微博认证:AI博主

我这两天刷到Hugging Face更新了一组数据,在开源模型下载量这个榜单上,中国模型居然登顶了。

千问,全球第一。

下载量已经突破10亿次,平均每天被下载110万次。

这也意味着千问已经完全超越了美国的Llama,稳居开源大模型全球第一。

在聊这个数据之前,先跟大家简单聊一下为什么Hugging Face下载量这个指标很重要。

因为这相当于全球开发者真金白银的投票,你愿意花时间下载一个模型,愿意花精力部署、调试、跑通,说明你是真的觉得它好用。

下载量可以说是评判开源模型实际应用落地的核心指标。

但是,为什么还要看衍生模型数量?

这里需要解释一下开源生态的一个逻辑:下载量说明有人在用,但衍生模型数量说明有人在基于它创造新东西。

你下载一个模型,可能只是拿来跑个demo试试。

但如果你基于它做二次开发,训练出一个新模型,还把这个新模型也开源出去,这说明你是真的认可它的底层能力。

这种二次开发会形成滚雪球效应,好的基座模型吸引开发者,开发者做出衍生模型,衍生模型又吸引更多人关注原模型。

生态就是这么滚起来的。

Hugging Face的数据显示,基于千问的衍生模型已经突破20万个。
全球第一个达成这个里程碑的开源大模型。 每天还在以超过200个的速度新增。

这些衍生模型涵盖机器人控制、代码生成、漫画后期制作、多语种翻译等方向。

比如最近开发者圈子里很火的一个多角度相机控制工具,就是基于千问的图像编辑模型再训练出来的。

再说回千问超越Llama。

过去几年,Llama一直是开源界的老大。
Meta在这个领域投入了大量资源,全球开发者也习惯了以Llama为基座做开发。

但现在,风向变了。

MIT和Hugging Face联合做过一项研究,分析了全球22亿次模型下载行为。
结论是中国开源AI模型的采用份额已经达到17.1%,首次超过美国的15.8%。

这个超越不是小事。
过去几年,中国在AI领域一直被认为是追赶者。
现在至少在开源这条赛道上,角色正在发生变化。

说回具体的使用场景。
光有下载量还不够,关键是谁在用、用来干什么。

斯坦福李飞飞团队基于千问训练出了新模型s1,进一步拓展了开源社区对AI推理的探索。

美国艾伦AI研究所把千问视为AI社区探索强化学习新技术的事实基座模型。

再来看商业落地,技术好只是第一步,能不能转化成实际价值才是关键。
在国内,千问已经被嵌入了手机、音箱、眼镜等各种智能设备。

好用加上免费,让它成为最受企业欢迎的开源模型。

海外的表现更有说服力,亚马逊和爱彼迎这些硅谷公司都在用千问模型训练机器人、发展新业务。

新加坡国家AI计划本来打算用Meta的模型,后来改选了千问。

原因很简单,千问3支持119种语言和方言,不像此前欧美的主流大模型(比如 Llama等),对东南亚小语种支持薄弱。
在千问3基础上训练出的新模型,在东南亚语言上的表现特别好。

缅甸语、菲律宾语、印尼语、马来语、泰米尔语、泰语、越南语,这七种语言的权威评测里,Qwen-SEA-LION-v4达到当前开源模型最佳水平。

一个中国模型被东南亚国家选中做国家级AI项目的底座,这在几年前是不可想象的事情。

业内大佬是怎么看这件事的?
Google DeepMind的CEO哈萨比斯接受CNBC采访时说,中国AI模型和美国的差距可能只有几个月。

这话从哈萨比斯嘴里说出来,分量很重。
他是AlphaGo的缔造者,也是全球AI领域最顶尖的科学家之一。

英伟达CEO黄仁勋在财报电话会上也提过,阿里巴巴的千问大模型是开源AI模型之中最好的。

所以,开源为什么重要?
因为它决定了AI技术最终会以什么方式普及。

如果开源模型够好,中小企业和个人开发者就能低成本地使用AI能力,创新的门槛会大幅降低。

反过来,如果只有闭源模型能打,AI就会变成少数大公司的专属工具。

从这个角度看,中国开源模型的崛起不只是一场商业竞争的胜利,它是让AI技术惠及更多人的一个重要推动力。

当全球的开发者都在用中国的开源模型时,中国AI的影响力就不仅仅体现在下载量上了。
它会渗透到各种产品、各种应用、各种创新当中,成为全球数字经济基础设施的一部分。

这才是10亿次下载真正的意义。

发布于 上海