CodeArena放榜:千问3.7编程仅次于Claude
刚刚,全球权威编程榜单 Code Arena正式放榜,千问最新旗舰模型 Qwen3.7-Max得分 1541,超越GPT-5.5、Gemini-3.5-Flash、GLM-5.1、Kimi-K2.6等一众模型,仅次于Claude系列,在大模型厂商中排名全球第二。
🥊全球权威编程榜单 Code Arena
这是由知名第三方大模型盲测平台 LMArena 推出的最具影响力的编程能力榜单之一。与传统的代码基准测试不同,Code Arena 由开发者出题,要求模型从零生成完整的、可交互的 Web 应用程序,并交由用户对匿名模型进行两两 PK 盲测投票,根据投票综合生成最终榜单。因此,Code Arena 也被视为目前 全球最具公信力的 AI 编程能力评测 之一。
🌟编程突出的 Qwen3.7-Max
Qwen3.7-Max 在 Code Arena 榜单中斩获 1541 分,次于最强模型Claude-opus-4.7,可媲美Claude-opus-4.6,是目前榜单中唯一突破 1540 分大关的国产大模型。
在真实项目交付能力上,Qwen3.7-Max 同样表现出色:能在数小时内独立完成专业团队耗时 2 周的复杂项目端到端交付;可持续运行 35 小时,累计完成超 1000 次工具调用的复杂长程任务,甚至能自我编程优化芯片内核。
感谢全球开发者的每一次投票和反馈,我们将继续努力,打磨更好的模型给大家。
#Qwen##千问大模型##千问##AI##大模型#
发布于 浙江
