通义实验室 25-04-22 14:04
微博认证:通义大模型官方微博

超写实3D数字人大模型(LAM)技术报告解读

🔥 单图秒级生成超写实3D数字人:得益于我们设计的2D图像与3D高斯点交互Transformer,可以在海量视频数据上训练,获得可泛化的3D高斯先验模型,从而做到单张图即可Feedforward秒级生成可驱动3D人头模型。
🔥 跨平台超实时驱动渲染:我们基于WebGL搭建了整个驱动和渲染框架,生成的3D人头模型可以基于WebGL在任意设备上超实时运行,在手机端都可以跑满120FPS。
🔥 低延迟实时交互对话数字人SDK:基于生成的3D数字人,我们搭建了完整的实时交互对话工程链路,包括LLM、ASR、TTS和数字人模块,即输入一张图片、即可与这张图片所生成的数字人化身进行低延迟的实时对话,应用于客服、教育、陪伴等场景。

📚 论文已被图形学顶会SIGGRAPH 2025接收,全文👉 LAM: Large Avatar Model for One-shot Animatable Gaussian Head
项目主页: github/projects/LAM
代码库: github/aigc3d/LAM
在线演示: huggingface/spaces/LAM
#通义# http://t.cn/A6dyPSjL

发布于 浙江