驱动中国官方
26-06-04 09:24 微博认证:驱动中国官方微博

#京东新AI实现对话改视频#京东今日官宣开源 JoyAI-Echo 长音视频生成框架,直击行业长期痛点:人物形象崩坏、音色飘忽、生成效率偏低,还上线对话式编辑,改动单个镜头不用重新渲染整条视频,官方称该项技术跻身全球长视频生成第一梯队。

框架搭载专属记忆库,留存角色样貌与人声数据,实测 5 分钟成片全程角色形象、音色统一。依托记忆驱动训练方案,融合 SFT、跨模态 RLHF、DMD 多项技术,单靠 DMD 就能提速约 7.5 倍。内置 Director Agent 智能导演助理,口头提需求即可自动拆分剧本、人物、场景与镜头内容。

配套实时超分工具,支持两档画质升级:736×1280 可分别升至 1152×1920、1472×2560,一键产出高清音视频素材。

发布于 陕西