Qwen3-Coder-flash这个模型，就是Qwen3-Coder-30B-A3B-Instruct确实有点东西啊。在3060 12G的显卡上，4比特量化，速度可以达到34 token/s，这个速度已经是不错了，反正你不会感觉慢。如果是4090，那个速度就更快了，不过我没有测。以前这种模型都是玩具，是用来学习和研究的。现在真的可以干点事

Qwen3-Coder-flash这个模型，就是Qwen3-Coder-30B-A3B-Instruct确实有点东西啊。

在3060 12G的显卡上，4比特量化，速度可以达到34 token/s，这个速度已经是不错了，反正你不会感觉慢。
如果是4090，那个速度就更快了，不过我没有测。

以前这种模型都是玩具，是用来学习和研究的。
现在真的可以干点事情了。

我让它写了一个小球跳动的，一次性完成，效果不错。
然后又让它写了一个俄罗斯方块，也是一次性完成。
就是左右移动的时候，移动的格子有点大，其余没有问题。

这在前面的版本中，哪怕参数大一些，也是经常搞不定的。

本来还想用gemini cli之类的来试试它的调用工具能力和综合能力的。
结果发现ollama适配Qwen3-Coder-flash的时候，没有适配工具。

这个可以让我们看到两个前景：
1.这个级别的模型，在特定的场景，完全是可以能训练出来的。
目前只是编码场景，其它场景，比如设计、写作、法律、医疗等等也可以做到。

2.可以以极低成本跑在大部分的电脑上，价格完全可以承受。

应该说Qwen3-Coder-flash只是刚刚跨国门槛，未来的潜力还很大。

Qwen团队在训练Qwen3编码模型的时候，利用阿里云的基础设施构建了一个可扩展的系统，能够并行运行 20,000 个独立环境，然后通过获得环境中各种工具的反馈来训练，极大的增强了智能体的能力。
说明这种方法是有效的。

这只是开始，智能体的时代正向我们稳步走来。

模型地址：www.modelscope.cn/models/Qwen/Qwen3-Coder-30B-A3B-Instruct

发布于江苏