#生成式AI# 【单张显卡实时生成3D世界,李飞飞World Labs推出全新世界模型RTFM】
当地时间 10 月 16 日,由知名学者#李飞飞# 领衔的创业公司 World Labs 宣布推出 RTFM(Real-Time Frame Model,实时框架模型)。这是一款能够实时生成交互式三维世界的全新世界模型,据团队介绍,RTFM 仅需单块 H100 GPU,就能实时生成可交互的三维世界。
去年十二月,World Labs 推出了首个重磅产品,展示了从单张图片生成持久三维世界的能力。彼时,业界已经为这种“图生世界”的技术所震撼。而如今发布的 RTFM,则在效率和交互性上实现了新的突破。
按照 World Labs 官方的描述,RTFM 围绕三个核心设计原则展开。
首先是效率——这款模型能够在单张 H100 GPU 上以交互式帧率运行推理。在生成式人工智能领域,算力消耗一直是制约技术落地的瓶颈。若要实现四千分辨率、每秒六十帧的交互式视频流,传统视频架构需要每秒生成超过十万个 token,这相当于每秒输出一本《弗兰肯斯坦》或《哈利·波特》第一部的文本量。要让这样的生成持续一小时以上,系统需要处理超过一亿个 token 的上下文。这在当前的计算基础设施下既不可行,也不经济。
李飞飞团队信奉所谓的“苦涩教训”(The Bitter Lesson):那些能够优雅地随计算资源扩展的简单方法,往往会在 #AI# 发展中胜出,因为它们能够受益于计算成本的指数级下降。
戳链接查看详情:http://t.cn/AXw72wQ6
