#Seedance和谷歌Omni谁更强#
谷歌凌晨发了Gemini Omni Flash,官方定位高得吓人——“能根据任何输入创造出任何内容”。但发布会后不少人的第一反应不是惊叹,而是打开Seedance 2.0跑了一遍对比。
先说Gemini Omni Flash的核心卖点:原生多模态输入。它能一口气吃进图片、音频、视频和文字四样素材,理解它们之间的关联,然后生成一段整合后的视频,而且支持对话式编辑——你可以像聊天一样让它改角色、换背景、调场景。这是Veo 3.1做不到的事,也是谷歌把视频生成推向“世界模型”方向的关键一步。首批上线的是Omni Flash,走轻量快速路线,但实际体验效果参差不齐,连谷歌自己都说了,更强的Omni Pro在后面。
再说Seedance 2.0。字节今年2月发布,目前在Artificial Analysis的Video Arena上以Elo 1269分(文生视频)和1351分(图生视频)持续霸榜,压着Veo 3、Sora 2、Kling 3.0和Runway Gen-4.5。Seedance强的地方很具体:一是写真感——也就是真实场景的还原度和画质细腻度,在这个维度上Seedance至今是标杆;二是物理模拟,重力、流体、碰撞的还原下了血本,尤其在做复杂动作序列时,时间一致性误差率不到4.7%;三是可用率高,据说2.0版本的良品率已达90%,做AI短剧的公司已经在正经用它出活儿了,不是玩具。
两家目前的差距在哪里?有人总结得很到位:Seedance在写实和画质上是天花板,但在风格化、角色开发、动画这些领域不够强;Omni的“工程感”更强,多模态输入整合和对话式编辑的灵活性是Seedance目前没有的,但在纯画质上距离Seedance还有一段路。换句话说,Seedance更像一个精修过的专业摄影棚,Omni更像一个什么都能往里丢的万能编辑台。
最后聊一个更根本的问题:AI视频的终局会是赢者通吃还是多强并立?我个人倾向于后者。Seedance在做“专业创作者的生产力工具”,Omni在做“人人能用的视频版Nano Banana”,两家走的是不同的产品路线。加上Runway在好莱坞的深度嵌入、Kling在亚洲短剧圈的性价比优势、Sora 2的物理理解能力,这个赛道短期内不会出现一家独大的局面。谁先解决“从demo到交付”的最后一公里,谁才会真正拉开差距。
