大模型又来“价格屠夫”了。根据报道，堪称AI教母的李飞飞，率团队训练出了媲美DeepSeek R1的推理模型，而云计算费用还不到50美元。一顿火锅的钱，就把大模型搞定了。是不是很神奇？秘诀是，这款模型并非从零开始，而是以阿里云通义千问（Qwen）模型为基座，进行监督微调。而根据报道，不少国内外宣称

大模型又来“价格屠夫”了。根据报道，堪称AI教母的李飞飞，率团队训练出了媲美DeepSeek R1的推理模型，而云计算费用还不到50美元。一顿火锅的钱，就把大模型搞定了。是不是很神奇？秘诀是，这款模型并非从零开始，而是以阿里云通义千问（Qwen）模型为基座，进行监督微调。而根据报道，不少国内外宣称低成本的模型，不少也是基于通义模型为基座进行蒸馏等方式。

通义大模型这么好用吗？正好业内最权威的大模型盲测榜单发布了，我看了下，Qwen2.5-Max，超越众多模型，包括DeepSeekV3、o1-mini在内。最终以1332分位列全球第七名，也是非推理类的中国大模型冠军。

这个成绩挺重要的。第一，证明了中国在AI领域，真不是一味地“陪跑”。我们自己也可以搞学霸级模型，而且还是好几家企业你追我赶。对提振科技信心很有帮助。第二，会加速AI产业落地。Qwen2.5-Max的数学能力、编程能力都是第一名，其他能力也妥妥超越了普通人；而阿里云又是国内公有云的重要玩家，覆盖面广。云和大模型的结合，可以迅速、高效地让多个行业用起来，享受AI红利。用户可以通过阿里云百炼调用新模型API、或者在Qwen Chat平台上中使用，非常便捷。
作为普通人，我们当然乐于看到这种气象。大模型企业的竞逐，就是我们享受AI乐趣的驱动力。必须为他们的突破点赞。

发布于上海