微博AI 26-01-27 10:44
微博认证:微博AI官方微博

【#阿里发布千问旗舰推理模型# 】
1月26日,阿里发布千问旗舰推理模型 Qwen3-Max-Thinking。根据官方介绍,其在多个关键维度上实现了显著提升,包括事实知识、复杂推理、指令遵循、人类偏好对齐以及智能体能力。在 19 项权威基准测试中,其性能可媲美 GPT-5.2-Thinking、Claude-Opus-4.5 和 Gemini 3 Pro 等顶尖模型。

千问新模型总参数超万亿,进行了更大规模的强化学习后训练,并通过推理技术的系列创新,最终完成模型性能的提升。在多项关键性能基准测试中,Qwen3-Max-Thinking 还大幅增强了自主调用工具的原生 Agent 能力,模型可像专业人士一样边用工具边思考。同时,模型幻觉也大为降低,为解决真实复杂任务打下基础。