多伦多大学、Snap Inc.和UCLA的研究团队推出了一款名为Wonderland的新模型,它能够从单张图像生成高质量的3D场景,标志着单视图3D场景生成领域取得了突破性进展。通过引入相机位姿控制,Wonderland在视频生成过程中嵌入了多视角信息,确保3D一致性。
利用ControlNet和LoRA模块,实现了对复杂相机视角变化的精确控制,显著提升视频质量和几何一致性。使用单张A100 GPU,Wonderland仅需约5分钟即可生成完整的3D场景,相比其他方法如Cat3D(16分钟)和ZeroNVS(3小时),分别提升了3.2倍和36倍的速度。#ai创造营#
发布于 浙江
