LL3M:多智能体协作,利用大语言模型生成可编辑的Blender 3D代码
• 创新点:将3D形状生成转化为Python代码编写任务,突破传统基于3D数据训练生成模型的限制,实现更高的模块化与可编辑性。
• 多智能体架构:规划、检索、编码、视觉批评、验证及用户反馈六大智能体协同工作,分阶段完成初始建模、自动优化及用户引导的迭代细化。
• BlenderRAG知识库:集成Blender官方文档,提供实时检索支持,显著提升代码复杂度(复杂操作使用增加5倍)并降低执行错误率(减少26%),生成更高质量模型。
• 可解释代码输出:生成结构清晰、注释详尽、参数可调的Blender Python脚本,方便用户直接修改参数或代码,实现细粒度控制与创意共创。
• 交互式迭代设计:支持基于自然语言的连续指令,精准调整几何形状及材质属性,避免全模型重复生成,极大提升设计效率与用户体验。
• 丰富案例展示:涵盖多样形态(动物、乐器、家具、场景)、复杂结构及多材质表现,支持图片输入多模态生成及场景层级关系构建。
• 性能表现:初始生成约4分钟,自动优化约6分钟,后续用户编辑平均38秒,满足实际创作流程需求。
• 对比优势:相较单一LLM方案,LL3M多智能体框架在细节丰富度和视觉逼真度上均有显著提升。
LL3M以代码为媒介,融合语言理解与3D建模,开辟了高质量、可控、开放词汇的3D资产生成新路径,促进自动化与艺术创作的深度结合。
论文🔗 arxiv.org/abs/2508.08228
了解详情🔗 threedle.github.io/ll3m
#人工智能# #3D建模# #大语言模型# #自动化设计# #Blender# #代码生成#
发布于 北京
