看到影视飓风发的最新视频了吗?首先 Seedance 2.0 视频生成模型非常牛对吧?但是,Tim 在视频里讲了一件事,大家注意了没有?Tim 说让 Seedance 2.0 用它的照片生成一段视频的时候,它并没有提供音频文件,而生成的视频当中的声音就是他自己的。
为什么 Seedance 2.0 能够做到这一点呢?答案显而易见,就是肯定用影视飓风的视频做过训练,AI 自动识别了,一看是 Tim 就用 Tim 自己的声音自动配音了。
其实,这件事就说明了为什么中国两大短视频平台,抖音(字节的即梦)和快手(可灵),分别搞出了全中国最牛,并且在全世界都有竞争力的视频模型。
而目前海外最能打的图片和视频模型 Nano Banana 和 Veo 由拥有 YouTube 的谷歌推出的。
因为:数据就是护城河
视频生成模型需要海量的高质量视频数据来训练。谁手里有最多的视频?自然是那些运营着超级视频平台的公司。
抖音和快手每天产生的短视频数量是天文数字级别的,而且经过用户的点赞、完播率、分享等行为筛选,平台对什么是好内容有着极其精细的理解。YouTube 作为全球最大的视频平台,也坐拥二十年积累的视频资产。
这些数据对于训练视频模型来说,价值无可替代。你可以有最顶尖的算法团队、最强的算力,但没有数据,一切都是空谈。
不仅如此,这些平台不只是有数据,它们还深刻理解什么样的内容能打动人。
抖音的推荐算法、快手的社区运营、YouTube 的内容生态,这些公司花了多年时间研究人类对视频内容的偏好。什么节奏让人看得下去?什么画面有冲击力?什么转场让人舒服?这些隐性知识沉淀在平台的产品逻辑和数据标注体系里,最终都会反哺到模型训练中。
更关键的是,这些公司有天然的应用场景来验证和迭代模型。
字节做出好的视频模型,可以直接用在剪映里让用户用起来,收集反馈,快速迭代。谷歌的 Veo 可以直接整合进 YouTube 的创作工具。这种从数据到模型到产品再到新数据的闭环,是纯做模型的公司很难复制的。
这其实印证了一个规律:在 AI 时代,拥有某个领域最大数据资产的公司,最有可能在这个领域做出最好的模型。
文本领域,搜索引擎和社交平台有优势。图片领域,图库和设计平台有优势。视频领域,视频平台有优势。
所以我们看到的不是巧合,而是数据主权决定 AI 能力的必然结果。
反过来想,如果你想预测哪家公司会在某个垂直领域的 AI 模型上胜出,先看看谁拥有那个领域最大的数据资产,答案往往就藏在那里。
#科技先锋官##HOW I AI#
发布于 山东
