德里克文 25-12-08 11:10
微博认证:AINEXT 联合创始人 AI博主

【AI快讯】美团发布并开源图像生成模型
12月8日早上,#美团发布并开源 LongCat-Image 图像生成模型#,旨在打破当前AI图像领域闭源性能强劲与开源能力不足的“两难困境”,为开发者社区提供高性能、低门槛的新选择。
该模型以紧凑的6B参数规模,通过高性能架构和系统化训练策略,成功在文生图和图像编辑的核心能力上逼近更大尺寸闭源模型的效果。
LongCat-Image在图像编辑领域达到开源SOTA水平,具备高度可控性,并采用多任务联合学习机制来提升对复杂指令的理解和泛化性。
针对中文应用痛点,模型通过课程学习策略和字符级编码,实现了8105个通用规范汉字的精准渲染,大幅领先其他参评模型。
此外,模型利用对抗训练框架提升了图像的物理真实感和纹理细节,并全面开源多阶段模型,同时提供LongCat APP和LongCat.ai等零门槛的AI创作入口。

LongCat.ai 网页端高效创作入口:http://t.cn/AXPwc5Ly

🔗 开源资源链接:
Hugging Face:
http://t.cn/AXyoFuRl
GitHub:
http://t.cn/AXyoFuRj

#科技先锋官##AI生活指南#

发布于 福建