谷歌推出Genie3：只一句提示词就能创建可交互的虚拟世界！当地时间 8 月 5 日，谷歌 DeepMind 发布了 Genie 3 通用世界模型，用户使用一句简单提示词或一张图像就能创建实时交互式虚拟世界。与前代产品相比，Genie 3 在视觉效果和实时性方面有了显著提升，从“生成可互动视频”变成了“实时生成可互

谷歌推出Genie3：只一句提示词就能创建可交互的虚拟世界！

当地时间 8 月 5 日，谷歌 DeepMind 发布了 Genie 3 通用世界模型，用户使用一句简单提示词或一张图像就能创建实时交互式虚拟世界。与前代产品相比，Genie 3 在视觉效果和实时性方面有了显著提升，从“生成可互动视频”变成了“实时生成可互动世界”。

例如，Genie 3 的“可提示事件”功能令用户可以向虚拟世界中随时添加或更改物体，也可以改变天气条件或插入新角色。此外，Genie 3 生成的不再是预先渲染好的视频，而是以 720p 分辨率和 24fps 的帧率实时运行的交互世界，互动时间也从十几秒提升至数分钟，并且具备长达一分钟的视觉记忆。这一特性不仅为游戏开发提供了新的思路，使游戏世界更具动态性，也为 AI 研究提供了重要工具。

DeepMind方面表示，通用世界模型能够生成无限的交互式环境，可用于训练 AI 模型，尤其是“具身智能体”，以应对现实世界中的复杂情况。此前 DeepMind 曾通过游戏如围棋和《星际争霸》推动 AI 发展，而 Genie 3 则进一步拓展了这一领域。它不仅可以用于游戏开发，还能为 AI 提供合成数据，解决训练数据稀缺的问题。尽管游戏行业对这类工具的实用性存在质疑，但 Genie 3 无疑为 AI 和游戏开发带来了新的可能性。
#热门微博# #科技快讯# #人工智能# #谷歌大模型#

发布于广东