26-05-03 11:54 微博认证:北京七月在线科技有限公司 创始人

《Fast-WAM——训练时保留视频联合训练(虽同时生成但动作token不看视频token),在推理时则移除显式的未来视频生成,直接在单次前向中,依托得到的潜在世界表征KV Cache预测动作》
http://t.cn/AXJ6vAb8 ​

发布于 湖南