腾讯的可编辑3D世界生成模型开源啦🥹!HY-World 2.0:把文本、图片、视频转成 3D 世界资产
这个仓库做的是 3D 世界生成和 3D 世界重建。输入可以是文本、单张图、多视角图片、视频,输出是 mesh、3DGS、point cloud 这类 3D 资产。
它和很多 world model 的区别,在于目标不是生成一段视频,而是生成可以编辑、可以接进工作流的 3D 内容。README 里写到,这些输出可以接到 Unity、Unreal、Isaac 这类引擎里。
现在已经公开的部分,主要是 world reconstruction,也就是把多视角图片或普通视频重建成 3D。对应的代码、权重、文档、调用方式都已经放出来了。另一部分是 world generation,也就是从文本或单张图生成可导航的 3D 场景,这条链路的结构已经写在 README 里,完整代码还没有全部公开。
如果你关心游戏、仿真、embodied AI,这个仓库值得看,因为它在做的不是视频生成,而是 3D 资产生成。
💻 仓库:http://t.cn/AXMraCcI
📄 技术报告:http://t.cn/AXMraCcf
#ai生活指南##how i ai##ai工具#
发布于 贵州
