新智元 26-04-22 09:44
微博认证:新智元官方微博

奥特曼亲自上阵,Images 2.0登顶王座!大米刻字,生图跨入GPT-5时代#How I AI#

Images 2.0是一次质的飞跃,它在精准听懂长指令、准确摆放并理清物体间关系、渲染密集文本方面有了巨大突破。

最重要的是,它是首个具备「思考能力」的图像模型,可以联网搜索实时信息、二次自检。

它还能一次性直出八张风格连贯的图,最高支持2K超清分辨率。

这么说吧,Images 2.0的出世,重新定义了视觉生成的统治力——

像素级精度:小字号文本、图标、UI元素等复杂细节一键生成,支持3:1到1:3全尺寸输出;
多语言质变:中日韩等非拉丁文字精准渲染,不仅字拼得对,语句也通顺连贯;
风格成熟:照片级逼真感,电影剧照、像素艺术、漫画等视觉语言都拿捏得住;
会思考:首个具备推理能力的图像模型,能联网搜索、自检输出,知识更新至2025年12月。

在Arena最新榜单中,Images 2.0一骑绝尘,登顶全球AI生图王座。实力暴击谷歌Nano Banana 2/Pro版本,领先242分。

它在全部7个文生图类别中,全部位列第一。

最狠的是,它可以做到像素级生成。

直播中生成的一张米山图,其中的一颗大米粒,竟刻上了「GPT image 2」的字体。

奥特曼还秀了一番,和4o图像负责人Gabriel Goh一起更多GPU的漫画图。

网友们纷纷上手,被Images 2.0的实力再次惊艳到了。

甚至,有人表示,「OpenAI终于再次引领图像生成领域」!