阿里云昨天又发新一代模型了,Qwen3.7-Max。(这迭代速度有点吓人,明明记得3.6才出来没多久……)
这次最大的变化,我感觉是AI不再跟你“唠嗑”了,而是真能“干活”了。周靖人说大模型正在从“说得好”变成“做得到”——这句话我挺认同的。
说个最震撼我的数据:这模型在一个它从没见过的国产芯片(平头哥真武M890)上,完全靠自己,持续编程了整整35个小时!没有人类帮忙,自己试了400多次、调用了上千次工具,最后硬是把芯片速度提了10倍。这真的是“打工人”级别的韧性了……
当然,跑分也是实打实的。在三方机构Arena盲测里,Qwen3.7-Max跟GPT、Claude最强版差不多,国产排第一。
其实吧,现在头部模型能力差距越来越小,拼的就是谁能耐住性子把复杂任务做完整。
我觉得这方向是对的——AI的价值不只是解闷,是得真帮你把事儿办了。 http://t.cn/AX6ZQr1Z
发布于 福建
