挨踢牛魔王 26-02-17 09:54
微博认证:科技博主

Qwen3.5 开源了,这个版本没有让人失望。
这是一个全能的基座模型。

Qwen3.5-397B-A17B,总参数397B,激活参数17B,默认支持 100 万上下文长度、官方内置工具以及自适应工具调用能力。
如果和闭源模型相比,这个参数只能算中等,闭源模型很多是1T及以上的。

但是本地部署就算了,到了这个阶段,个人就不用想用消费级显卡进行本地部署了。
倒是企业,肯定是可以考虑本地部署的。

下面,一个一个特性解读一下:

统一的视觉-语言基础:在多模态 token 上进行早期融合训练,在推理、编码、智能体和视觉理解等基准测试中,跨代际达到与 Qwen3 相当的水平,并超越 Qwen3-VL 模型。
这个很不错,多模态还是需要的,现在国产开源模型,就kimi 2.5作为重点。
你想,你编程的时候,一个界面问题,说半天说不清楚,就丢张图给它就行了。
在做智能体的时候,视觉也是必须,有时候还是要看屏幕的。

高效混合架构:门控 Delta 网络结合稀疏混合专家(MoE)机制,在保持极低延迟和成本开销的同时实现高吞吐推理。
这个是基于阿里获得全球 AI 顶会 NeurIPS 2025 的论文《Attention Gating Makes Better Foundation Models》原理做的,也开源出来了。

可扩展的强化学习泛化能力:在百万级智能体环境中进行强化学习训练,任务分布逐步复杂化,从而获得强大的现实世界适应能力。
针对各种智能体环境做了强化,这个现在是常规操作了,就是操作各种命令行,软件,工具,都能比较准确。

全球语言覆盖:支持扩展至 201 种语言和方言,实现包容性的全球部署,并具备细致入微的文化与区域理解能力。
这个是针对全球化的。

下一代训练基础设施:相比纯文本训练,多模态训练效率接近 100%,并采用异步强化学习框架,支持大规模智能体脚手架和环境编排。

已经相当逼近闭源模型了,提升还是明显的。

模型地址:www.modelscope.cn/models/Qwen/Qwen3.5-397B-A17B/summary

发布于 江苏