北大联合谷歌发布PaperBanana

#IT那些事儿# 北大和Google Cloud联合发布的PaperBanana，是一个自动化生成出版级学术插图的智能体框架。它能够根据研究方法描述和图表标题，自动生成包括方法架构图和统计图表在内的各类专业插图。
PaperBanana的论文：arxiv.org/abs/2601.23265

PaperBanana把AI深度融入科研绘图流程，它不只是生成一张图，而是像设计师一样思考：检索参考图→规划内容→确定风格→生成图像→自我审查。完全开源，基于NeurIPS 2025的292个真实论文案例训练。

不像普通AI工具直接生成图片，PaperBanana有五个专门的AI Agent分工合作：Retriever检索参考图、Planner规划内容、Stylist确定风格、Visualizer生成图像、Critic审查优化。像专业团队一样协作，而不是单打独斗。
其中Stylist Agent专门负责确保符合学术期刊的审美标准——配色、字体、线条粗细都有规范。
如果你已经画了图但觉得不够好看，PaperBanana还能帮你"升级"——保持内容不变，优化配色和排版。

仓库地址：github.com/dwzhu-pku/PaperBanana 说是两周后放出代码和数据集。

发布于北京