Qwen3.5-Omni正式发布

🚀 Qwen3.5-Omni 正式发布：215 项 SOTA，原生全模态新标杆！

千问最新一代全模态模型 Qwen3.5-Omni 正式发布！支持文本，图片，音频，音视频理解，包含 Plus、Flash、Light三种尺寸的Instruct版本，灵活适配不同场景需求，更在离线智能与实时交互两大维度实现了突破。

💡 突出亮点：惊喜涌现的「氛围编程」
Qwen3.5-Omni-Plus 自发涌现出 Audio-Visual Vibe Coding 能力：只需对着镜头描述创意，即可转化为可运行的代码。

🧠 离线模式：硬核智力升级
• 精细化音视频Caption：支持时间戳、场景切片及角色-音频映射，输出剧本级详细描述！
• 业界领先性能：在215项音视频/音频子任务与基准测试中全面领先！音频任务超越 Gemini-3.1 Pro，音视频理解能力与 Gemini-3.1 Pro对齐。
• 原生多模态：基于超1亿小时音视频数据训练，支持长达10小时音频输入，及超过 400 秒的 720P（1 FPS）音视频输入。
• 多语言支持：语音识别覆盖113种语言及方言，语音合成支持36种语言及方言。

🎙️在线模式：拟人实时交互
• 细粒度语音控制：实时调节情绪、语速、音量。
• 个性化声音克隆：上传语音样本，即可定制拥有克隆音色的专属AI助手。
• 语义级打断：精准识别意图，有效过滤无意义的背景噪音干扰与附和回应。
• 联网增强：内置 WebSearch 与复杂工具调用。

👉 快来试试：
• Blog: http://t.cn/AXIIxPBc
• QwenChat：http://t.cn/A61p8knY
• 阿里云百炼：
离线：http://t.cn/AXIIxPBU
实时：http://t.cn/AXIIxPBy
• 魔搭社区：
离线：http://t.cn/AXIIxPB4
实时：http://t.cn/AXIIxPBb
#通义实验室##Qwen# http://t.cn/AXIIxYtB

发布于浙江