腾讯混元团队开源的多模态生图模型 HunyuanImage 3.0,以 800 亿参数规模登顶 LMArena 文生图双榜,在盲测中击败谷歌 Nano-Banana 和字节 Seedream4.0。
模型支持 4096x4096 像素输出,基本足够印刷级海报制作。测试数据显示,在生成包含 5 个以上实体对象的场景时,物体位置准确度达 89.3%,比上一代提升 23 个百分点。并且比如图二这种,会对生成内容包含的文本和图像信息的逻辑性有很好的保持。
技术文档显示,该模型训练消耗了 75 万小时 A100 显卡算力,处理过 2.4 亿张带标注图像。
#ai创造营##人工智能 #
发布于 江苏
