能不能拿捏nano-banana? Qwen-Image-2.0 测试!
之前我给大家做nano-banana 测评的时候, 大家最诟病的就是 nano-banana 生成的人物面部不够还原, 大家看上去感觉不是一个人.
Qwen-Image-2.0 刚发布, 于是我也测了一下, 结果发现卧槽有救了! 而且还能精细调整! 甚至精细调整的指令遵循非常到位. 直接给大家看我测的效果:
首先我想把我的照片和一个AI生成的放鞭炮的3D场景结合到一起, 变成我拿着鞭炮捂耳朵. 来看 nano-banana-pro 生成的, 最终这个版本被我弃用了, 最大的问题是感觉不是很像我自己.
以及它还有点幻觉(衬衫口袋那里的灰色标签, 而且衬衫是没口袋的)
另外 nano-banana-pro 默认特别喜欢给人物增加一个黑色的轮廓线, 有点无主之地游戏那种感觉(美漫风格).
来看我用 Qwen-Image-2.0 的效果, 第一次出图就很符合我的预期, 需要的部分都还原到位了, 然后本次更新其实内置了一个Enable Prompt Thinking功能, 简单来说就是模型思考用户输入的简化内容, 给提示词做进一步的优化。P4的配图中,对此有非常详细的对比展示。千问APP之后也会上新模型,大家可以届时体验一下。
另外本次文本能力也很强,我测试了650字左右的生成,可以成功实现。以及1700个英文字符的简单排版也是可以的。
另外 Qwen-Image-2.0 还是个文生图&图片编辑二合一模型, 这一波给力啊!
#HOW I AI#
#阿里千问# #QwenImage2# #QwenImage# #图片编辑模型# #文生图模型# #多模态模型#
发布于 北京
