大模型又来“价格屠夫”了。根据报道,堪称AI教母的李飞飞,率团队训练出了媲美DeepSeek R1的推理模型,而云计算费用还不到50美元。一顿火锅的钱,就把大模型搞定了。是不是很神奇?秘诀是,这款模型并非从零开始,而是以阿里云通义千问(Qwen)模型为基座,进行监督微调。而根据报道,不少国内外宣称低成本的模型,不少也是基于通义模型为基座进行蒸馏等方式。
通义大模型这么好用吗?正好业内最权威的大模型盲测榜单发布了,我看了下,Qwen2.5-Max,超越众多模型,包括DeepSeekV3、o1-mini在内。最终以1332分位列全球第七名,也是非推理类的中国大模型冠军。
这个成绩挺重要的。第一,证明了中国在AI领域,真不是一味地“陪跑”。我们自己也可以搞学霸级模型,而且还是好几家企业你追我赶。对提振科技信心很有帮助。第二,会加速AI产业落地。Qwen2.5-Max的数学能力、编程能力都是第一名,其他能力也妥妥超越了普通人;而阿里云又是国内公有云的重要玩家,覆盖面广。云和大模型的结合,可以迅速、高效地让多个行业用起来,享受AI红利。用户可以通过阿里云百炼调用新模型API、或者在Qwen Chat平台上中使用,非常便捷。
作为普通人,我们当然乐于看到这种气象。大模型企业的竞逐,就是我们享受AI乐趣的驱动力。必须为他们的突破点赞。
发布于 上海
