腾讯混元团队开源的多模态生图模型 HunyuanImage 3.0，以 800 亿参数规模登顶 LMArena 文生图双榜，在盲测中击败谷歌 Nano-Banana 和字节 Seedream4.0。模型支持 4096x4096 像素输出，基本足够印刷级海报制作。测试数据显示，在生成包含 5 个以上实体对象的场景时，物体位置准确度达 89.3%，比上一代

腾讯混元团队开源的多模态生图模型 HunyuanImage 3.0，以 800 亿参数规模登顶 LMArena 文生图双榜，在盲测中击败谷歌 Nano-Banana 和字节 Seedream4.0。

模型支持 4096x4096 像素输出，基本足够印刷级海报制作。测试数据显示，在生成包含 5 个以上实体对象的场景时，物体位置准确度达 89.3%，比上一代提升 23 个百分点。并且比如图二这种，会对生成内容包含的文本和图像信息的逻辑性有很好的保持。

技术文档显示，该模型训练消耗了 75 万小时 A100 显卡算力，处理过 2.4 亿张带标注图像。

#ai创造营##人工智能 #

发布于江苏