OpenAI发布ChatGPT Images 2.0

OpenAI 正式发布了 ChatGPT Images 2.0，Sam Altman 的说法是，这次升级相当于从 GPT-3 直接跳到 GPT-5。

开发团队详细盘点了升级后的亮点，最直观的变化，是解决了之前图像生成模型最头疼的文字渲染问题，拼写错误现在几乎找不到了。演示里直接生成了整页的杂志版面，就连小号文字都没问题。无论是中文、日文、韩文、甚至印地语，这些有几千个字符的语言，现在都可以生成整页文字，且零错误。团队负责人 Gabriel 说他们专门在这方面下了功夫，希望全球用户都能用母语创作。

模型分两个版本。即时模式向所有用户免费开放，响应快，画质和设计感都很强。思考模式面向付费用户，生成前会先“想一想”，能调用网页搜索获取最新信息，并且一次能够生成多张角色和风格一致的图片，还可以生成直接可用的二维码。演示里用一个提示词直接生成了三页剧情连续的漫画，角色前后一致。

画质方面，标准输出 2K 分辨率，API 支持4K 模式。支持最高 3:1 的极端宽高比，演示里生成了一张月球 360 度全景图，放进全景查看器里看，光影方向都是对的。细节精度方面也极为出色，团队用 4K API 生成了一堆米粒的照片，其中一粒米上写着“GPT Image”，放大后清晰可见。

最重要的是，ChatGPT Images 2.0 已不再是那种传统的 “输入提示词输出一张图” 的绘画工具，它能围绕图像进行多轮对话。团队成员 Kiwhan 说得很准确，它更像一个用图像来回应你的 AI，而不只是一个图像生成器。

#GPT-Images-2.0##OpenAI##AI创造营# http://t.cn/AXx0YqBA

发布于上海