卢松松 26-03-31 09:47
微博认证:IT独立博主 卢松松 头条文章作者

阿里发布了Qwen3.5-Omni,这可能是林俊旸离职后的首个重量级发布了,看来通义团队确实顶住了压力,而且节奏非常紧凑。

这个版本在音频、语音、视频 215项SOTA,属于行业第一。在音频理解上超过了gemini3.1 pro,视频理解上和它差不多。

阿里出的这个版本主要是针对“实时语音交互”这个赛道,估计是为以后的千问AI眼镜、各种AI耳机、汽车智能座驾铺路。

发布于 北京