实时驱动高清数字人唇动同步,SyncTalk_2D 来了!
SyncTalk_2D 是一个基于 SyncTalk 和 Ultralight-Digital-Human 的 2D 唇动视频生成模型,支持低延迟、高质量的实时唇形同步。相比原版,我们优化了音频特征编码器,分辨率提升至 328,适配更高清的视频输入,助力打造商业级数字人。
主要特点:
- 高清晰度唇动同步,适合实时视频生成和驱动;
- 改进的音频编码,提升同步准确度;
- 支持高分辨率输入,画面更细腻;
- 兼容多平台,方便定制和集成。
适合数字人、虚拟主播、实时互动等多种场景。感兴趣的开发者和研究者可以直接从 GitHub 获取代码,快速上手。
GitHub 地址:
github.com/ZiqiaoPeng/SyncTalk_2D
发布于 河北
