摇摆时间线ZHLMI 25-10-17 21:56
微博认证:上海慧龙计算机系统有限公司多媒体经理

魔搭 DiffSynth-Studio 团队与麦橘 MERJIC 合作推出的开源 Lora 模型 Face-to-Photo。基于 Qwen-Image-Edit,专为人脸图像生成而优化,将一张普通的人脸照片转化为质感精美的高质量图像。http://t.cn/AXwweVrh

面部的保持和还原还不错,不过我感觉这个模型很依赖输入面部的角度,当然对一个 Lora 不能有太多要求。值得期待的是他们更深层次的战略合作,比如后续计划中会基于通义千问 Qwen-Image,共同打造一个全新的开源视觉模型底座——麦橘惊鸿 majicGenos,这个底模在保留 Qwen-Image 文字生成的基础上,还会完美适配 Qwen-Image 的所有 Lora,也会是首个支持 2K 直出生图的 Qwen 模型。

发布于 上海