哈勃观察员 25-08-07 18:25
微博认证:科学科普博主 头条文章作者

谷歌推出Genie3:只一句提示词就能创建可交互的虚拟世界!

当地时间 8 月 5 日,谷歌 DeepMind 发布了 Genie 3 通用世界模型,用户使用一句简单提示词或一张图像就能创建实时交互式虚拟世界。与前代产品相比,Genie 3 在视觉效果和实时性方面有了显著提升,从“生成可互动视频”变成了“实时生成可互动世界”。

例如,Genie 3 的“可提示事件”功能令用户可以向虚拟世界中随时添加或更改物体,也可以改变天气条件或插入新角色。此外,Genie 3 生成的不再是预先渲染好的视频,而是以 720p 分辨率和 24fps 的帧率实时运行的交互世界,互动时间也从十几秒提升至数分钟,并且具备长达一分钟的视觉记忆。这一特性不仅为游戏开发提供了新的思路,使游戏世界更具动态性,也为 AI 研究提供了重要工具。

DeepMind方面表示,通用世界模型能够生成无限的交互式环境,可用于训练 AI 模型,尤其是“具身智能体”,以应对现实世界中的复杂情况。此前 DeepMind 曾通过游戏如围棋和《星际争霸》推动 AI 发展,而 Genie 3 则进一步拓展了这一领域。它不仅可以用于游戏开发,还能为 AI 提供合成数据,解决训练数据稀缺的问题。尽管游戏行业对这类工具的实用性存在质疑,但 Genie 3 无疑为 AI 和游戏开发带来了新的可能性。
#热门微博# #科技快讯# #人工智能# #谷歌大模型#

发布于 广东