蚁工厂 26-01-14 10:17
微博认证:科技博主

智谱发布自己的图像生成模型GLM-Image了
官方介绍是这是一款开源的工业级离散自回归图像生成模型,在文本渲染和知识密集型生成场景中表现优异。看样图也是大量文字内容优秀,不过整体图片质感和真实性差点。
技术上结合了自回归模块和扩散解码器,旨在解决复杂信息表达和知识密集型任务中的图像生成问题。该模型的自回归部分基于 GLM-4-9B-0414,,扩散解码器则参考了 CogView4,采用了 70 亿参数的单流 DiT 结构。
#科技先锋官##ai创造营#

发布于 山东