OpenAI 放出了 GPT-Image-2,LMArena 文生图排行榜的 Elo 评分从前任冠军 Nano Banana 2 的 1270 飙到 1512,领先 250 多分。
GPT-Image-2 到底强在哪里?AI 技术博主 Matthew Berman 对这个模型进行了测试和深入解析。最核心的不同在于它更理解世界,例如让它画各种信息图图,或者绘制黑板上的方程求解过程。无论文字还是数据都更加准确。
Matthew 实测的结果,图像一致性大幅提升,同一个角色从远景推到眼球特写,连续的七张图,风格和细节都能保持一致。文字渲染能力很强,产品包装上带水珠遮挡的变形文字都能处理得很自然。分辨率支持到 2K,放大后,能看到米粒的细节。宽高比也更灵活了,现在终于支持 16:9 了。
当然,短板也很明显,GPT-Image-2 的计数能力还是不稳定。例如,要求画 7 个杯子经常给出现 8 个。人手还是会翻车,比例会失调。名人脸方面,网上素材多的像 Elon Musk 画得很像,素材少的就不太行。
这两天我也测了不少,目前感觉整体和 Nano Banana 2 差不多,尤其是图片的真实感和美学上没拉开差距。只有信息图里小字的准确性和清晰度比 Nano Banana 2 有明显进步。
#GPT-Image-2##AI绘画##OpenAI##AI创造营# http://t.cn/AXxKcggC
发布于 上海
