天啦,黑森林工作室的flux.2来了。
我完全没想到他们今年还会再发布一个大版本。
可能是nano banana pro给的压力太大。
特点:
多引用支持:同时引用多达10张图片,具有当今最佳字符/产品/风格一致性。
图像细节和逼真:更大的细节、更清晰的纹理和更稳定的照明,适用于产品拍摄、可视化和类似摄影的用例。
文本渲染:复杂的排版、信息图表、模因和具有可读精细文本的用户界面模型现在在生产中可靠地工作。
增强的提示遵循:改进了对复杂、结构化指令的遵守,包括多部分提示和构成约束。
世界知识:更基于现实世界的知识、照明和空间逻辑,从而产生具有预期行为的更连贯的场景。
更高的分辨率和灵活的输入/输出比例:分辨率高达400万像素的图像编辑。
版本:
FLUX.2系列涵盖了一系列模型产品,从完全管理的、生产就绪的API到开发人员可以自己运行的开放权重检查点。 下面的概述图显示了FLUX.2 [pro]、FLUX.2 [flex]、FLUX.2 [dev]和FLUX.2 [klein]如何平衡性能和控制
FLUX.2 [pro]:最先进的图像质量,可与最好的封闭模型相媲美,与其他模型相匹配,实现快速粘附和视觉保真度,同时以更快和更低的成本生成图像。 在速度和质量之间不妥协。 →现在可在BFL Playground、BFL API和我们的发布合作伙伴获得。
FLUX.2 [flex]:控制模型参数,如步数和指导比例,让开发人员完全控制质量、及时遵守和速度。 该模型在渲染文本和精细细节方面表现出色。 →现在可在bfl.ai/play、BFL API和我们的启动合作伙伴处获得。
FLUX.2 [dev]:32B开放权重模型,源自FLUX.2基础模型。 当今最强大的开放权重图像生成和编辑模型,将文本到图像合成和图像编辑与单个检查点中的多个输入图像相结合。 FLUX.2 [dev]权重在Hugging Face上可用,可以通过FAL、Replicate、Runware、Verda、TogetherAI、Cloudflare、DeepInfra上的API端点使用。 在GeForce RTX GPU上运行FLUX.2 [dev],与NVIDIA和ComfyUI合作创建的FLUX.2 [dev]的优化fp8参考实现进行本地实验。 如需商业许可证,请访问我们的网站。
FLUX.2 [klein](即将推出):开源,Apache 2.0模型,从FLUX.2基础模型中蒸馏出来。 与从头开始训练的相同尺寸的可比模型更强大、更易于开发人员使用,其功能与教师模型相同。
FLUX.2 - VAE:一种用于前置表示的新型变异自动编码器,在可学习性、质量和压缩率之间提供优化的权衡。 该模型为所有FLUX.2流动骨干提供了基础,此处提供了描述其技术特性的深入报告。 FLUX.2 - VAE在Apache 2.0许可证下在HF上可用。
今天太晚了,明天给大家解读。
