karminski-牙医 25-08-05 08:56
微博认证:AI博主

来啦! 给大家带来刚发布的 Qwen-Image 文生图实测!

由于 Qwen-Image 本次最大的亮点是高保真度文本渲染, 所以本次测试集中在文本上.

直接说结论:

在我的测试下最大文本渲染可以支持到60个字, 文本最多建议控制在3个平面以内. 如果是不规则表面, 最大建议控制在一个不规则表面, 10个字以内.

另外, 给大家分享小技巧, 每次抽卡是有 seed 的, 比如我那个60字的 seed 就是 9466702. 大家也可能会抽到比我这个更好的seed, 这时候你就可以复制下来, 然后用这个seed 来生成, 这样就能达到更好的效果了.

本次测试花费3小时, 总计消费了 大概50块的 HuggingFace Zero GPU 费用. 值得一提的是, 千问-Image 看大小参数量可能在 20B, 实际生成时用的是两块 H200, 显存占用60G左右, 每次生成大概24秒.

模型地址: huggingface.co/Qwen/Qwen-Image

#ai创造营##ai生活指南# http://t.cn/A6FRaop4

发布于 北京