Qwen3.5开源:原生多模态,极致高效率!
各位!新年快乐!我们最新一代原生多模态模型Qwen3.5-397B-A17B正式开源!
该模型性能媲美全球顶级闭源模型,实现模型架构的全面革新。此次发布的版本总参数为3970亿,激活仅170亿,部署显存占用降低60%,推理效率大幅提升,最大吞吐量可提升至19倍。
核心亮点:
1️⃣原生多模态能力跃迁:千问3.5系列进行大规模的视觉和文本混合数据进行预训练,大幅新增中英文、多语言、STEM和推理等数据,在推理、编程、Agent智能体等全方位基准评估中均表现优异。
2️⃣视觉能力飞跃:在MathVision、RealWorldQA、CC_OCR、RefCOCO-avg、MLVU等众多评测中斩获最优性能。相比专项模型Qwen3-VL,其在空间定位、带图推理及学科解题等任务中表现更优。可支持长达1M token上下文,2小时的视频直接输入,同时,视觉与代码能力原生融合,可实现手绘草图到前端代码的转换。
3️⃣Transformer架构的创新:融入了获2025 NeurIPS最佳论文的自研门控技术,结合线性注意力机制与高稀疏度MoE架构,实现了397B总参数激活仅17B的极致模型效率。通过训练稳定性优化与多token预测等技术,在常用的32K上下文场景中,千问3.5推理吞吐量可提升8.6倍;在256K超长上下文情况下,Qwen3.5推理吞吐量最大提升至19倍,推理效率大幅提升。
4️⃣从Agent框架到应用:在移动端支持更多主流APP与指令,在PC端可处理更复杂的多步骤操作,完成跨应用数据整理、流程自动化等复杂任务。同时,构建可扩展的Agent异步强化学习框架,端到端可加速3到5倍,并将基于插件的智能体Agent支持扩展至百万级规模。
针对不同需求,千问3.5扩展至支持201种语言,词表大小从150k扩展到250K,可最高提升小语种60%的编码效率。
欢迎大家通过Qwen Chat、千问APP、千问PC端免费体验模型,前往魔搭社区和HuggingFace进行下载部署,通过阿里云百炼直接获取API服务,百万tokens最低至0.8元。
#Qwen##AI##大模型#
