零重力瓦力 26-04-24 10:59
微博认证:AI博主

OpenAI 正式发布了 ChatGPT Images 2.0,Sam Altman 的说法是,这次升级相当于从 GPT-3 直接跳到 GPT-5。

开发团队详细盘点了升级后的亮点,最直观的变化,是解决了之前图像生成模型最头疼的文字渲染问题,拼写错误现在几乎找不到了。演示里直接生成了整页的杂志版面,就连小号文字都没问题。无论是中文、日文、韩文、甚至印地语,这些有几千个字符的语言,现在都可以生成整页文字,且零错误。团队负责人 Gabriel 说他们专门在这方面下了功夫,希望全球用户都能用母语创作。

模型分两个版本。即时模式向所有用户免费开放,响应快,画质和设计感都很强。思考模式面向付费用户,生成前会先“想一想”,能调用网页搜索获取最新信息,并且一次能够生成多张角色和风格一致的图片,还可以生成直接可用的二维码。演示里用一个提示词直接生成了三页剧情连续的漫画,角色前后一致。

画质方面,标准输出 2K 分辨率,API 支持4K 模式。支持最高 3:1 的极端宽高比,演示里生成了一张月球 360 度全景图,放进全景查看器里看,光影方向都是对的。细节精度方面也极为出色,团队用 4K API 生成了一堆米粒的照片,其中一粒米上写着“GPT Image”,放大后清晰可见。

最重要的是,ChatGPT Images 2.0 已不再是那种传统的 “输入提示词输出一张图” 的绘画工具,它能围绕图像进行多轮对话。团队成员 Kiwhan 说得很准确,它更像一个用图像来回应你的 AI,而不只是一个图像生成器。

#GPT-Images-2.0##OpenAI##AI创造营# http://t.cn/AXx0YqBA

发布于 上海