AI-GitHub 25-04-14 11:05
微博认证:科技博主

高质量SVG生成!OmniSVG :支持“文生SVG/图生SVG/角色定制”,无限放大也不糊!

OmnisVG 是复旦大学和 StepFun 联合开发的全球首个端到端多模态 SVG(可缩放矢量图形)生成模型!

基于预训练视觉语言模型(VLM),通过创新的 SVG 标记化方法,将 SVG 命令和坐标参数化为离散令牌,实现了结构逻辑与几何细节的解耦。使 OmnisVG 能高效生成从简单图标到复杂动漫角色的多样化高质量 SVG 图形。

主要功能:

多模态生成:OmniSVG是首个端到端的多模态SVG生成模型,能根据文本描述、图像参考或角色参考生成高质量的SVG图形。可以生成从简单图标到复杂动漫角色的多样化图形。

高效生成与训练:基于预训练的视觉语言模型(VLM)Qwen-VL,OmniSVG通过创新的SVG标记化方法,将SVG命令和坐标参数化为离散令牌,在训练过程中分离了结构逻辑与几何细节。使训练效率较传统方法提升了3倍以上,能处理多达3万个令牌的序列,支持生成具有丰富细节的复杂SVG。

数据集与评估:OmniSVG团队发布了MMSVG-2M数据集,包含200万个带多模态标注的SVG资源,涵盖图标、插图和角色三大子集。提出了标准化的评估协议MMSVG-Bench,用于测试条件SVG生成任务的性能。

可编辑性与实用性:生成的SVG文件具有无限可缩放性和完全可编辑性,能无缝集成到专业设计工作流程中,如AdobeIllustrator等工具,提高了Al生成图形在图形设计、网页开发等领域的实用性。

GitHub:http://t.cn/A6rpfzj3
#ai开源项目##ai技术##新星闪光计划##github##SVG生成#

发布于 重庆