#IT那些事儿# 北大和Google Cloud联合发布的PaperBanana,是一个自动化生成出版级学术插图的智能体框架。它能够根据研究方法描述和图表标题,自动生成包括方法架构图和统计图表在内的各类专业插图。
PaperBanana的论文:arxiv.org/abs/2601.23265
PaperBanana把AI深度融入科研绘图流程,它不只是生成一张图,而是像设计师一样思考:检索参考图→规划内容→确定风格→生成图像→自我审查。完全开源,基于NeurIPS 2025的292个真实论文案例训练。
不像普通AI工具直接生成图片,PaperBanana有五个专门的AI Agent分工合作:Retriever检索参考图、Planner规划内容、Stylist确定风格、Visualizer生成图像、Critic审查优化。像专业团队一样协作,而不是单打独斗。
其中Stylist Agent专门负责确保符合学术期刊的审美标准——配色、字体、线条粗细都有规范。
如果你已经画了图但觉得不够好看,PaperBanana还能帮你"升级"——保持内容不变,优化配色和排版。
仓库地址:github.com/dwzhu-pku/PaperBanana 说是两周后放出代码和数据集。
发布于 北京
