鳗鱼缸缸 25-10-05 17:50
微博认证:AI博主

#人工智能[超话]#阿里Qwen3大模型具有以下新特点:

- 混合推理架构 :采用混合专家(MoE)架构,Qwen3系列包括2个MoE模型和6个dense模型,参数量从0.6B到235B。它将“快思考”与“慢思考”集成进同一个模型,可无缝切换“思考模式”与“非思考模式”,“思考模式”专攻复杂任务,“非思考模式”专注于高速、通用型回应。
- 性能大幅提升 :预训练数据量达36T tokens,涵盖119种语言和方言,并在后训练阶段经过多轮强化学习。Qwen3在推理、指令遵循、工具调用、多语言能力等方面均大幅增强,其推理性能和通用能力可比肩Gemini-2.5 pro、O4-mini等闭源模型,并创下全球开源模型SOTA最佳性能表现。
- 部署成本降低 :显存占用仅为性能相近模型的三分之一,例如旗舰模型Qwen3-235B-A22B仅需4张H20即可部署,大大降低了部署成本。
- 智能体功能强化 :原生支持模型上下文协议(MCP),具有强大的函数调用能力(Function Calling),复杂智能体任务表现居开源模型之首,可通过Qwen-Agent框架快速集成外部工具。
- 多模态能力突出:9月23日,阿里通义大模型团队开源Qwen3-Omni、Qwen3-TTS、Qwen-Image-Edit-2509三大多模态模型。其中Qwen3-Omni在36项音视频测试中获32项开源SOTA,Qwen3-TTS支持17种音色10种语言,Qwen-Image-Edit能多图拼接等。

发布于 福建