Simon的白日梦 24-03-28 20:00
微博认证:科技博主

2017年就玩Jun-Yan Zhu大佬的pix2pix & cycleGAN,简直是我AIGC时代的开端。现在2024年了,居然还出了个turbo版,不仅更快,而且更强了😮他真的,我哭死🥹

GitHub - GaParmar/img2img-turbo: 使用稳定扩散turbo进行一步式图像到图像转换:sketch2image、day2night等

🧐img2img-turbo项目提供了一种通过对抗学习适配新任务和领域的一步式扩散模型,如SD-Turbo,允许用户利用预训练扩散模型的内部知识进行高效推理,例如对512x512图像,在A6000上耗时0.29秒,在A100上仅需0.11秒。

➡️链接:http://t.cn/A6TGDBoQ

✨重点
●🔄 项目中的单步条件模型CycleGAN-Turbo和pix2pix-turbo能够执行各种图像到图像的转换任务,适用于成对和非成对设置。
●🎨 CycleGAN-Turbo在现有的基于GAN和基于扩散的方法中表现更佳,而pix2pix-turbo与最新的研究如ControlNet进行Sketch2Photo和Edge2Image的比较,但具有单步推理的优势。
●🔧 生成器架构紧密集成了原始潜在扩散模型中的三个独立模块到一个具有小型可训练权重的端到端网络,从而可以翻译输入图像x到输出y,同时保留输入场景结构。
●🚀 为了实现高效的推理,该研究使用了LoRA适配器,并在输入和输出之间引入跳跃连接和Zero-Convs,并对U-Net的第一层进行重新训练。
●🖼 结果展示了该方法可以从相同的输入条件生成不同风格的输出,输出风格可以通过改变文本提示来控制。
●👩‍💻 项目提供了环境设置指南和Gradio演示,支持本地运行和配对图像翻译任务。
●⚙️ 使用方法包括为成对和非成对图像翻译任务提供的命令行示例,用户可以轻松测试和实现day2night、night2day、clear2rainy等图像转换。

发布于 奥地利