【GenRL:多模态基础世界模型,为通用具身智能体提供支持,能够将语言和视频提示嵌入到具身领域,通过解码模型的潜在状态序列来可视化预期行为,进而训练智能体执行任务】'GenRL - Multimodal Foundation World Models for Generalist Embodied Agents' GitHub: github.com/mazpie/genrl #强化学习# #多模态# #具身智能体# #基础模型#
发布于 北京
