一个新的图像模型HiDream-O1,是智象未来出的。
这个是中科大背景的团队。
这个模型,怎么说呢?
画质跟sdxl差不多,就文字能力还可以。
你现在要是想用这个实用,是比较难的。
但是,这个模型探索了一个新的方向,就是无VAE的模式。
啥意思呢?
就是图像模型,以前都是要用VAE压缩到潜空间,这个里面就会有损失。
但是这么做的原因,就是运行速度变快了。
现在图像模型,已经开始探索,不压缩,直接在像素空间运算。
这样,很多损失可以避免,可以完成很多精细的操作。
这可能是未来的一个趋势。
在chatgpt-image-2爆火的今天,还有国内团队在图像这个领域勇于探索。
只非常值得赞扬的。
这个模型8B,comfyui还没支持。
希望他们后面能提升训练质量,做出卓越的,比肩chatgpt-image-2的图像模型出来。
模型地址:www.modelscope.cn/models/HiDream-ai/HiDream-O1-Image/summary
发布于 江苏
