张岱樾 26-04-20 10:30
微博认证:AI博主

腾讯的这次发布真是太出色了。

HY-World 2.0,一个开放的3D世界模型,能将文本、图像或视频转化为可编辑的3D资产,比如网格和3D高斯溅射

在架构方面,关键在于他们没有试图一次性创建整个3D世界,而是将其拆分成4个更简单的任务:生成宽广的场景视图,规划相机如何在其中移动,填充缺失的部分,然后将结果转化为可用的3D场景。

这使得输出更加稳定和实用,因为它更接近于构建一个你可以四处走动的地方,而不是生成一个只能从一个角度看起来不错的短视频。

发布于 广东