Qwen3.5开源_新浪新闻

Qwen3.5开源：原生多模态，极致高效率！

各位！新年快乐！我们最新一代原生多模态模型Qwen3.5-397B-A17B正式开源！
该模型性能媲美全球顶级闭源模型，实现模型架构的全面革新。此次发布的版本总参数为3970亿，激活仅170亿，部署显存占用降低60%，推理效率大幅提升，最大吞吐量可提升至19倍。

核心亮点：
1️⃣原生多模态能力跃迁：千问3.5系列进行大规模的视觉和文本混合数据进行预训练，大幅新增中英文、多语言、STEM和推理等数据，在推理、编程、Agent智能体等全方位基准评估中均表现优异。
2️⃣视觉能力飞跃：在MathVision、RealWorldQA、CC_OCR、RefCOCO-avg、MLVU等众多评测中斩获最优性能。相比专项模型Qwen3-VL，其在空间定位、带图推理及学科解题等任务中表现更优。可支持长达1M token上下文，2小时的视频直接输入，同时，视觉与代码能力原生融合，可实现手绘草图到前端代码的转换。
3️⃣Transformer架构的创新：融入了获2025 NeurIPS最佳论文的自研门控技术，结合线性注意力机制与高稀疏度MoE架构，实现了397B总参数激活仅17B的极致模型效率。通过训练稳定性优化与多token预测等技术，在常用的32K上下文场景中，千问3.5推理吞吐量可提升8.6倍；在256K超长上下文情况下，Qwen3.5推理吞吐量最大提升至19倍，推理效率大幅提升。
4️⃣从Agent框架到应用：在移动端支持更多主流APP与指令，在PC端可处理更复杂的多步骤操作，完成跨应用数据整理、流程自动化等复杂任务。同时，构建可扩展的Agent异步强化学习框架，端到端可加速3到5倍，并将基于插件的智能体Agent支持扩展至百万级规模。

针对不同需求，千问3.5扩展至支持201种语言，词表大小从150k扩展到250K，可最高提升小语种60%的编码效率。

欢迎大家通过Qwen Chat、千问APP、千问PC端免费体验模型，前往魔搭社区和HuggingFace进行下载部署，通过阿里云百炼直接获取API服务，百万tokens最低至0.8元。
#Qwen##AI##大模型#

发布于浙江