带精确控制（类似controlnet）的wan2.2开源视频生成模型发布了~！🥹alibaba-pai/Wan2.2-VACE-Fun-A14B · Hugging Face🧐 这是阿里巴巴 PAI 发布的 Wan2.2-VACE-Fun-A14B 文生视频模型，基于 Wan2.2-T2V-A14B，支持 Canny/Depth/Pose/MLSD/轨迹控制/主体指定等多种控制方式，能在多分辨率（512/7

带精确控制（类似controlnet）的wan2.2开源视频生成模型发布了~！🥹
alibaba-pai/Wan2.2-VACE-Fun-A14B · Hugging Face
🧐 这是阿里巴巴 PAI 发布的 Wan2.2-VACE-Fun-A14B 文生视频模型，基于 Wan2.2-T2V-A14B，支持 Canny/Depth/Pose/MLSD/轨迹控制/主体指定等多种控制方式，能在多分辨率（512/768/1024）下生成 81 帧、16fps 的多语言视频，强调可控性与工业级扩展。
➡️链接：http://t.cn/AXhZgWlT
✨重点

●🎥 核心能力：支持文生视频、图生视频、视频生视频和多种控制视频生成，结合参考图像或提示词进行可控输出。

●🧩 控制类型：Canny（边缘）、Depth（深度）、Pose（姿态）、MLSD（直线检测）、轨迹控制、相机视角控制（平移/缩放/旋转）。

●⚙️ 训练细节：81 帧、每秒 16 帧训练，支持多语言预测，适应不同分辨率（512/768/1024）。

●🚀 使用方式：
云端：Aliyun DSW（有免费 GPU 配额）、Docker 部署、ComfyUI 前端。
本地：需 60GB 空间，支持 Windows/Linux，Python3.10/3.11，CUDA 11.8/12.1，显卡 ≥12GB。

●💾 显存优化：提供 model_cpu_offload、qfloat8、sequential_cpu_offload 等模式，兼顾消费级显卡运行。

●🖼 生成模式：支持 prompt 文生视频、首尾图约束的图生视频、参考视频驱动的视频生视频，以及基于 Canny/Pose/Depth 等的可控生成。

●🔗 生态兼容：与 CogVideo、EasyAnimate、ComfyUI、VACE 等项目深度互通，可扩展 Lora 或其他 backbone。

●📄 开源协议：Apache 2.0，可商用。

#AI白日梦想家[超话]##ai创造营##你好人工智能时代##ai生活指南#

发布于广西