Qwen3.6-Plus编程能力测试

Qwen3.6-plus 实测! 新模型有哪些变化?

给大家带来刚刚正式发布的 Qwen3.6-Plus 的全方位编程能力测试, Qwen3.6-Plus 支持多模态输入, 所以可以做到给到图片还原设计.

首先是前端性能测试:
case1: 建模&空间理解测试, 使用 three.js 还原一块手表
case2: 建模&空间理解测试, 使用 three.js 还原一个分体键盘
case3: UI布局&组件测试, 给到 UI Kit 参考图来设计UI元素

直接来看结果, 测试结论是 Qwen3.6-Plus 的空间理解比 Qwen3.5 & Qwen3.5-Plus 都提升不少, 可以看Qwen3.5-Plus还原键盘的这个对比, 这次大部分键帽都还原了位置(注意左下还是丢了一些), 甚至还给键帽上增加了丝印文本.

UI组件还原也可圈可点, 设计元素基本还原了, 可以看到进度条,滑块,选项框这几个还原得不太好, 不过这个基础是可以的, 让模型再修正几次就能用了.

再来看后端测试, 仍然使用从0编写向量数据库的 vector-db-bench, 这次测试结果就一般了, 得分最大值是95.5, 在我测试的模型中应该是中等偏上的水平, 没有超过之前Qwen3.5-plus.

以及考验大模型 Agent 能力的硅基骑手测试, 得分是572.16, 而 Qwen3.5-plus 则是 668.43. 当然 572.16 这个得分算是这个测试中的上游水平了, Agent能力本身并不弱. 作为对比 Qwen3-max 大概是300左右的水平.

总结来看, 这次 Qwen3.6-Plus 搭配 Qwen3.5-Plus 正好可以覆盖前端 + 后端,Agent 这些场景.

Qwen3.6-Plus 本次提升更多在前端, 空间理解, 使用代码建模上. 正在使用 Qwen 进行前端开发的同学可以直接换模型试试了, 应该会有不错的表现.

而后端和使用 Qwen 嵌入到 Agent 平台或者框架作为驱动模型的可以继续使用 Qwen3.5-Plus 或者对照实验一下再切换.

#HOW I AI##Qwen36plus##阿里千问##多模态模型##AIAgent##AI编程#

发布于北京