LL3M：多智能体协作，利用大语言模型生成可编辑的Blender 3D代码• 创新点：将3D形状生成转化为Python代码编写任务，突破传统基于3D数据训练生成模型的限制，实现更高的模块化与可编辑性。• 多智能体架构：规划、检索、编码、视觉批评、验证及用户反馈六大智能体协同工作，分阶段完成初始建模、自

LL3M：多智能体协作，利用大语言模型生成可编辑的Blender 3D代码

• 创新点：将3D形状生成转化为Python代码编写任务，突破传统基于3D数据训练生成模型的限制，实现更高的模块化与可编辑性。
• 多智能体架构：规划、检索、编码、视觉批评、验证及用户反馈六大智能体协同工作，分阶段完成初始建模、自动优化及用户引导的迭代细化。
• BlenderRAG知识库：集成Blender官方文档，提供实时检索支持，显著提升代码复杂度（复杂操作使用增加5倍）并降低执行错误率（减少26%），生成更高质量模型。
• 可解释代码输出：生成结构清晰、注释详尽、参数可调的Blender Python脚本，方便用户直接修改参数或代码，实现细粒度控制与创意共创。
• 交互式迭代设计：支持基于自然语言的连续指令，精准调整几何形状及材质属性，避免全模型重复生成，极大提升设计效率与用户体验。
• 丰富案例展示：涵盖多样形态（动物、乐器、家具、场景）、复杂结构及多材质表现，支持图片输入多模态生成及场景层级关系构建。
• 性能表现：初始生成约4分钟，自动优化约6分钟，后续用户编辑平均38秒，满足实际创作流程需求。
• 对比优势：相较单一LLM方案，LL3M多智能体框架在细节丰富度和视觉逼真度上均有显著提升。

LL3M以代码为媒介，融合语言理解与3D建模，开辟了高质量、可控、开放词汇的3D资产生成新路径，促进自动化与艺术创作的深度结合。

论文🔗 arxiv.org/abs/2508.08228
了解详情🔗 threedle.github.io/ll3m
#人工智能# #3D建模# #大语言模型# #自动化设计# #Blender# #代码生成#

发布于北京