GPT-Image-2发布_新浪新闻

OpenAI 放出了 GPT-Image-2，LMArena 文生图排行榜的 Elo 评分从前任冠军 Nano Banana 2 的 1270 飙到 1512，领先 250 多分。

GPT-Image-2 到底强在哪里？AI 技术博主 Matthew Berman 对这个模型进行了测试和深入解析。最核心的不同在于它更理解世界，例如让它画各种信息图图，或者绘制黑板上的方程求解过程。无论文字还是数据都更加准确。

Matthew 实测的结果，图像一致性大幅提升，同一个角色从远景推到眼球特写，连续的七张图，风格和细节都能保持一致。文字渲染能力很强，产品包装上带水珠遮挡的变形文字都能处理得很自然。分辨率支持到 2K，放大后，能看到米粒的细节。宽高比也更灵活了，现在终于支持 16:9 了。

当然，短板也很明显，GPT-Image-2 的计数能力还是不稳定。例如，要求画 7 个杯子经常给出现 8 个。人手还是会翻车，比例会失调。名人脸方面，网上素材多的像 Elon Musk 画得很像，素材少的就不太行。

这两天我也测了不少，目前感觉整体和 Nano Banana 2 差不多，尤其是图片的真实感和美学上没拉开差距。只有信息图里小字的准确性和清晰度比 Nano Banana 2 有明显进步。

#GPT-Image-2##AI绘画##OpenAI##AI创造营# http://t.cn/AXxKcggC

发布于上海