爱可可-爱生活 25-10-03 22:42
微博认证:AI博主 2025微博新锐新知博主

实时驱动高清数字人唇动同步,SyncTalk_2D 来了!

SyncTalk_2D 是一个基于 SyncTalk 和 Ultralight-Digital-Human 的 2D 唇动视频生成模型,支持低延迟、高质量的实时唇形同步。相比原版,我们优化了音频特征编码器,分辨率提升至 328,适配更高清的视频输入,助力打造商业级数字人。

主要特点:
- 高清晰度唇动同步,适合实时视频生成和驱动;
- 改进的音频编码,提升同步准确度;
- 支持高分辨率输入,画面更细腻;
- 兼容多平台,方便定制和集成。

适合数字人、虚拟主播、实时互动等多种场景。感兴趣的开发者和研究者可以直接从 GitHub 获取代码,快速上手。

GitHub 地址:
github.com/ZiqiaoPeng/SyncTalk_2D

发布于 河北