超写实3D数字人大模型（LAM）技术报告解读🔥 单图秒级生成超写实3D数字人：得益于我们设计的2D图像与3D高斯点交互Transformer，可以在海量视频数据上训练，获得可泛化的3D高斯先验模型，从而做到单张图即可Feedforward秒级生成可驱动3D人头模型。🔥 跨平台超实时驱动渲染：我们基于WebGL搭建

超写实3D数字人大模型（LAM）技术报告解读

🔥 单图秒级生成超写实3D数字人：得益于我们设计的2D图像与3D高斯点交互Transformer，可以在海量视频数据上训练，获得可泛化的3D高斯先验模型，从而做到单张图即可Feedforward秒级生成可驱动3D人头模型。
🔥 跨平台超实时驱动渲染：我们基于WebGL搭建了整个驱动和渲染框架，生成的3D人头模型可以基于WebGL在任意设备上超实时运行，在手机端都可以跑满120FPS。
🔥 低延迟实时交互对话数字人SDK：基于生成的3D数字人，我们搭建了完整的实时交互对话工程链路，包括LLM、ASR、TTS和数字人模块，即输入一张图片、即可与这张图片所生成的数字人化身进行低延迟的实时对话，应用于客服、教育、陪伴等场景。

📚 论文已被图形学顶会SIGGRAPH 2025接收，全文👉 LAM: Large Avatar Model for One-shot Animatable Gaussian Head
项目主页: github/projects/LAM
代码库: github/aigc3d/LAM
在线演示: huggingface/spaces/LAM
#通义# http://t.cn/A6dyPSjL

发布于浙江