通义实验室 26-03-30 21:07
微博认证:通义大模型官方微博

🚀 Qwen3.5-Omni 正式发布:215 项 SOTA,原生全模态新标杆!

千问最新一代全模态模型 Qwen3.5-Omni 正式发布!支持文本,图片,音频,音视频理解,包含 Plus、Flash、Light三种尺寸的Instruct版本,灵活适配不同场景需求,更在离线智能与实时交互两大维度实现了突破。

💡 突出亮点:惊喜涌现的「氛围编程」
Qwen3.5-Omni-Plus 自发涌现出 Audio-Visual Vibe Coding 能力:只需对着镜头描述创意,即可转化为可运行的代码。

🧠 离线模式:硬核智力升级
• 精细化音视频Caption: 支持时间戳、场景切片及角色-音频映射,输出剧本级详细描述!
• 业界领先性能: 在215项音视频/音频子任务与基准测试中全面领先!音频任务超越 Gemini-3.1 Pro,音视频理解能力与 Gemini-3.1 Pro对齐。
• 原生多模态:基于超1亿小时音视频数据训练,支持长达10小时音频输入,及超过 400 秒的 720P(1 FPS)音视频输入。
• 多语言支持:语音识别覆盖113种语言及方言,语音合成支持36种语言及方言。

🎙️在线模式:拟人实时交互
• 细粒度语音控制: 实时调节情绪、语速、音量。
• 个性化声音克隆: 上传语音样本,即可定制拥有克隆音色的专属AI助手。
• 语义级打断: 精准识别意图,有效过滤无意义的背景噪音干扰与附和回应。
• 联网增强: 内置 WebSearch 与复杂工具调用。

👉 快来试试:
• Blog: http://t.cn/AXIIxPBc
• QwenChat:http://t.cn/A61p8knY
• 阿里云百炼:
离线:http://t.cn/AXIIxPBU
实时:http://t.cn/AXIIxPBy
• 魔搭社区:
离线:http://t.cn/AXIIxPB4
实时:http://t.cn/AXIIxPBb
#通义实验室##Qwen# http://t.cn/AXIIxYtB

发布于 浙江