GLM-Image模型能力实测

500张图片测试! 一个视频告诉你GLM-Image怎么用!

给大家带来GLM-Image 实测!

我这次设计了两个极限测试, 来测试这个大模型的能力, 首先是模型的画面控制力, 怎样能让模型把对应的物体绘制到对应的位置? 于是我设计了色卡测试, 这个测试让模型绘制从1宫格到200宫格的图片. 看模型到什么程度才会崩溃, 结论是前5组图片绘制的都非常猛, 完全没有丢掉任何元素, 也就是说25个区域都是完全可控的, 接下来到6乘6才开始出现问题. 测试结果是, 如果平时用 GLM image 来绘制海报, 是绰绰有余的. 模型极限应该是64格, 即64个区域.

另外还有文本绘制能力测试, 文生图大模型都说自己文本渲染能力强, 有多强? 于是我截取了哈利波特小说的一部分, 让模型直接渲染, 我从10字开始测试, 每10个字递增, 一直测试到1000字. 测试了100张图片, 结果是, 模型在80字以内可以做到0失误, 这个是我目前测试过的模型的SOTA了, 太猛了. 模型的极限应该在200字左右.

总结, 这个模型只要我们文本控制在 80 字以内, 然后使用5×5 或更小的网格布局, 他就可以做到指哪打哪. 这是我总结的最佳实践.

目前这个模型已经可以在 bigmodel 上使用了. 有需要的同学可以马上去试试.

#ai生活指南##ai创造营##GLMImage##GLM##智谱##文生图大模型##nanobanana# http://t.cn/AXGiFlms

发布于北京