Flux Omini Kontext：基于 Flux.1-Kontext-dev 模型，创新性采用3D RoPE embeddings实现多图像参考的训练与推理，支持高自由度的图像编辑与角色插入。• 多图输入能力，结合输入图与参考图及位置偏移，提升图像生成的精准度与自然感。 • 3D RoPE嵌入技术突破传统2D限制，允许更细粒度的空间控制，

Flux Omini Kontext：基于 Flux.1-Kontext-dev 模型，创新性采用3D RoPE embeddings实现多图像参考的训练与推理，支持高自由度的图像编辑与角色插入。

• 多图输入能力，结合输入图与参考图及位置偏移，提升图像生成的精准度与自然感。
• 3D RoPE嵌入技术突破传统2D限制，允许更细粒度的空间控制，增强图像与角色的融合效果。
• 集成LoRA微调，训练只需额外0.1%参数，内存友好且训练高效。
• 训练基于PyTorch Lightning，支持AdamW、SGD等多种优化器，内置梯度检查点，适应大模型训练。
• 支持高级文本条件编码，结合CLIP与T5，实现复杂指令对图像的精准引导。
• 丰富示例覆盖空间与非空间角色插入，展示模型在场景融合上的潜力与未来可扩展性。
• 设计框架兼容ComfyUI，方便整合至多样化工作流。
• 公开代码与训练脚本，适配多GPU，支持持续迭代与社区贡献。

该项目不仅优化了多图像参考的交互方式，还以细节处理和灵活配置为核心，推动图像生成技术向更自然、更智能的方向发展。对于需要精准图像编辑和定制化角色插入的AI开发者和研究者，具备高度的实践价值和参考意义。

详见项目仓库🔗 github.com/Saquib764/omini-kontext
#人工智能# #图像生成# #深度学习# #多模态AI# #LoRA# #PyTorch#

发布于北京