阿里Qwen3大模型功能升级

#人工智能[超话]#阿里Qwen3大模型具有以下新特点：

- 混合推理架构：采用混合专家（MoE）架构，Qwen3系列包括2个MoE模型和6个dense模型，参数量从0.6B到235B。它将“快思考”与“慢思考”集成进同一个模型，可无缝切换“思考模式”与“非思考模式”，“思考模式”专攻复杂任务，“非思考模式”专注于高速、通用型回应。
- 性能大幅提升：预训练数据量达36T tokens，涵盖119种语言和方言，并在后训练阶段经过多轮强化学习。Qwen3在推理、指令遵循、工具调用、多语言能力等方面均大幅增强，其推理性能和通用能力可比肩Gemini-2.5 pro、O4-mini等闭源模型，并创下全球开源模型SOTA最佳性能表现。
- 部署成本降低：显存占用仅为性能相近模型的三分之一，例如旗舰模型Qwen3-235B-A22B仅需4张H20即可部署，大大降低了部署成本。
- 智能体功能强化：原生支持模型上下文协议（MCP），具有强大的函数调用能力（Function Calling），复杂智能体任务表现居开源模型之首，可通过Qwen-Agent框架快速集成外部工具。
- 多模态能力突出：9月23日，阿里通义大模型团队开源Qwen3-Omni、Qwen3-TTS、Qwen-Image-Edit-2509三大多模态模型。其中Qwen3-Omni在36项音视频测试中获32项开源SOTA，Qwen3-TTS支持17种音色10种语言，Qwen-Image-Edit能多图拼接等。

发布于福建