量子位 25-03-24 17:14
微博认证:量子位官方微博

#AI生成SVG矢量图##AI不只会画图还会写SVG代码#

对从事教学图、产品图和数据可视化的人来说,可无限缩放、不失真的SVG矢量图几乎是刚需。而AI模型StarVector,正是一款能画出高质量SVG图形的AI工具。

准确地说,不是画SVG,而是直接写SVG代码,而且写得那叫一个优雅,生产环境可以直接用的那种。

使用方法也很简单:给它一张图,或者一句文字描述,StarVector就能直接吐出一份标准的SVG代码。

这段代码采用了如等SVG原生语义元素,结构简洁,层级分明,视觉与语义兼顾。

更厉害的是,它支持从文本直接生成SVG。

比如你输入一句:“一个红色圆圈包着一个写着Start的矩形”,它就能还原出一个 的图形结构。

StarVector的背后,是一个名为SVG-Stack的专属数据集,包含210万组图像、SVG代码以及自动生成的文字描述。

这相当于给模型“看”完了一整座互联网的“设计图纸”,几乎任何图形风格它都能快速上手。

在评价指标上,传统像素级指标如MSE和SSIM在矢量图领域并不适用。

于是,StarVector自创了DinoScore,用DINOv2模型提取图像语义特征,再计算相似度,而非简单比对像素差异。

实验表明,DinoScore与人类主观评分高度一致。

StarVector提供两个版本,满足不同使用场景:

• StarVector-1B:轻量小模型,适合快速原型;
• StarVector-8B:重装旗舰版,搭配StarCoder2和更强图像编码器,能处理更复杂的图,效果也更精准。

性能上,StarVector生成一张图只需 74 秒,对比传统方法动辄20 多分钟,体验简直是降维打击。

别看它是代码驱动的、没有图像反馈、受限于16k token上下文,这些限制在实力面前都不值一提。

未来的 SVG 图形,很可能真的不是“画”出来的,而是AI 写出来的。

感兴趣的小伙伴可以点击:http://t.cn/A6B8dSGz
论文:http://t.cn/A6laneqd