带精确控制(类似controlnet)的wan2.2开源视频生成模型发布了~!🥹
alibaba-pai/Wan2.2-VACE-Fun-A14B · Hugging Face
🧐 这是阿里巴巴 PAI 发布的 Wan2.2-VACE-Fun-A14B 文生视频模型,基于 Wan2.2-T2V-A14B,支持 Canny/Depth/Pose/MLSD/轨迹控制/主体指定 等多种控制方式,能在多分辨率(512/768/1024)下生成 81 帧、16fps 的多语言视频,强调可控性与工业级扩展。
➡️链接:http://t.cn/AXhZgWlT
✨重点
●🎥 核心能力:支持文生视频、图生视频、视频生视频和多种控制视频生成,结合参考图像或提示词进行可控输出。
●🧩 控制类型:Canny(边缘)、Depth(深度)、Pose(姿态)、MLSD(直线检测)、轨迹控制、相机视角控制(平移/缩放/旋转)。
●⚙️ 训练细节:81 帧、每秒 16 帧训练,支持多语言预测,适应不同分辨率(512/768/1024)。
●🚀 使用方式:
云端:Aliyun DSW(有免费 GPU 配额)、Docker 部署、ComfyUI 前端。
本地:需 60GB 空间,支持 Windows/Linux,Python3.10/3.11,CUDA 11.8/12.1,显卡 ≥12GB。
●💾 显存优化:提供 model_cpu_offload、qfloat8、sequential_cpu_offload 等模式,兼顾消费级显卡运行。
●🖼 生成模式:支持 prompt 文生视频、首尾图约束的图生视频、参考视频驱动的视频生视频,以及基于 Canny/Pose/Depth 等的可控生成。
●🔗 生态兼容:与 CogVideo、EasyAnimate、ComfyUI、VACE 等项目深度互通,可扩展 Lora 或其他 backbone。
●📄 开源协议:Apache 2.0,可商用。
#AI白日梦想家[超话]##ai创造营##你好人工智能时代##ai生活指南#
