阿里Qwen3.5-Omni上线:全模态时代,普通人也能玩转音视频创作
阿里千问正式上线全模态大模型Qwen3.5-Omni,直接把AI创作门槛拉到新高度。
它的亮点是256k超长上下文,能处理超10小时音频、400秒720P视频,还有113种语种方言识别、36种合成能力,连小众方言都能精准拿捏。对咱们普通创作者来说,再也不用熬夜剪辑、逐字转写,上传视频就能自动生成带时间戳的详细字幕、章节切片,甚至能根据音视频情绪生成对应文案,效率直接翻倍。
更惊喜的是它的实时交互能力,语义打断、音色克隆、语音控制一应俱全,对话体验像和真人聊天一样自然。而且API价格超亲民,每百万Tokens不到0.8元,中小创作者也能轻松用起。
这波更新不只是技术升级,更是把复杂的音视频创作变成人人都能上手的工具,期待用它做出更多爆款内容!
发布于 广东
