阿里发布了Qwen3.5-Omni,这可能是林俊旸离职后的首个重量级发布了,看来通义团队确实顶住了压力,而且节奏非常紧凑。
这个版本在音频、语音、视频 215项SOTA,属于行业第一。在音频理解上超过了gemini3.1 pro,视频理解上和它差不多。
阿里出的这个版本主要是针对“实时语音交互”这个赛道,估计是为以后的千问AI眼镜、各种AI耳机、汽车智能座驾铺路。
发布于 北京
阿里发布了Qwen3.5-Omni,这可能是林俊旸离职后的首个重量级发布了,看来通义团队确实顶住了压力,而且节奏非常紧凑。
这个版本在音频、语音、视频 215项SOTA,属于行业第一。在音频理解上超过了gemini3.1 pro,视频理解上和它差不多。
阿里出的这个版本主要是针对“实时语音交互”这个赛道,估计是为以后的千问AI眼镜、各种AI耳机、汽车智能座驾铺路。