通义大模型 25-08-04 23:53
微博认证:通义大模型官方微博

书画双全!Qwen-Image开源

为家人们介绍我们最新的图像生成基础模型:Qwen-Image。它专注于提升AI在两大核心场景的能力:复杂的文本渲染与精准的图像编辑。
✨ 功能亮点:
1️⃣ 强大的文字渲染能力(本次开源)
● 效果领先:在多个文本测评榜单中,文字渲染均获得SOTA
● 原生渲染:文字是图像生成时直出的,而非后期添加,效果更真实。
● 功能全面:支持中英双语,多变字体,超长段落,超小文字,并可实现复杂的多位置图文布局。
● 基础扎实:除了文字,模型在人物情绪、细节刻画和多样的风格渲染上也同样表现出色。
2️⃣ 精准的图像编辑能力(即将发布)
● 效果稳定:多个图像编辑测评榜单SOTA
● 链式编辑:在多轮连续修改后,仍能保持主体ID的一致性。
● 文字编辑:可以编辑图像中的文字
● 复杂编辑:可编辑人物姿势,提取图像纹理等
#Qwen# http://t.cn/A6F80Bbn

发布于 浙江