[CV] AtomoVideo: High Fidelity Image-to-Video Generation
http://t.cn/A6Ym0CDj
介绍了AtomoVideo高保真度图像到视频生成框架。与现有技术相比,AtomoVideo通过多粒度图像注入技术,提高了视频对给定图像的保真度,同时在保持时间一致性和稳定性的前提下增强了视频的动态强度。AtomoVideo框架灵活地扩展到视频帧预测任务,并通过迭代生成实现长序列预测。论文强调了该框架与个性化模型和可控模块相结合的能力,通过定量和定性评估,AtomoVideo比流行方法取得了更优异的成果。此外,AtomoVideo在训练时采用zero terminal Signal-to-Noise Ratio和v-prediction策略,不依赖噪声先验来提高生成稳定性,这是其显著特点之一。
发布于 北京
