挨踢牛魔王 26-02-10 16:31
微博认证:科技博主

Qwen-Image-2.0发布了,是生图和编辑二合一的统一图像模型。
现在还没说开源的事情,但是在千问和阿里云百炼平台api做内测。

Qwen-Image-2.0有7B参数,还是比较轻量级的。

特点:
1.文字渲染准确度和长度提升了,支持1k token 的超长复杂指令。
2.信息图表,比如ppt,报告,思维导图,海报等等能力大大提升。
3.直出4K高清图,可以非常细腻的细节,比如皮肤毛孔,纹理等等
4.是一个统一全能模型,生图和编辑统一了。

统一图像模型是发展趋势,什么lora,controlnet,生图,编辑都会统一的。
早期图像方面,模型太多太杂,远不如大语言模型标准统一。
经过几年时间的发展,终于开始统一了,可以替换掉太多工作流了。

发布于 江苏