Qwen3-Coder-flash这个模型,就是Qwen3-Coder-30B-A3B-Instruct确实有点东西啊。
在3060 12G的显卡上,4比特量化,速度可以达到34 token/s,这个速度已经是不错了,反正你不会感觉慢。
如果是4090,那个速度就更快了,不过我没有测。
以前这种模型都是玩具,是用来学习和研究的。
现在真的可以干点事情了。
我让它写了一个小球跳动的,一次性完成,效果不错。
然后又让它写了一个俄罗斯方块,也是一次性完成。
就是左右移动的时候,移动的格子有点大,其余没有问题。
这在前面的版本中,哪怕参数大一些,也是经常搞不定的。
本来还想用gemini cli之类的来试试它的调用工具能力和综合能力的。
结果发现ollama适配Qwen3-Coder-flash的时候,没有适配工具。
这个可以让我们看到两个前景:
1.这个级别的模型,在特定的场景,完全是可以能训练出来的。
目前只是编码场景,其它场景,比如设计、写作、法律、医疗等等也可以做到。
2.可以以极低成本跑在大部分的电脑上,价格完全可以承受。
应该说Qwen3-Coder-flash只是刚刚跨国门槛,未来的潜力还很大。
Qwen团队在训练Qwen3编码模型的时候,利用阿里云的基础设施构建了一个可扩展的系统,能够并行运行 20,000 个独立环境,然后通过获得环境中各种工具的反馈来训练,极大的增强了智能体的能力。
说明这种方法是有效的。
这只是开始,智能体的时代正向我们稳步走来。
模型地址:www.modelscope.cn/models/Qwen/Qwen3-Coder-30B-A3B-Instruct
发布于 江苏
