阿里开源的这个工具有意思~!把任意comfyui工作流快速封装成MCP,可以在大语言模型对话中直接调用!
Pixelle-MCP:基于 ComfyUI + MCP + LLM 的开源多模态 AIGC 解决方案
🧐一句话总结:Pixelle-MCP 实现了 ComfyUI 工作流向 LLM 可调用工具的自动转化,支持文本、图像、语音、视频等全模态内容生成,构建了一个“0代码开发多模态 Agent 工具链”的强大框架,让 AIGC 能力以插件化方式接入任意大模型或 Agent 系统。
➡️链接:http://t.cn/A6FlU0pZ
✨重点
●🧩 核心机制:一套工作流 = 一个 MCP Tool = LLM 可用能力
通过 ComfyUI 画布构建的工作流,Pixelle-MCP 可自动解析其节点逻辑与参数需求,将其封装为标准 MCP 工具,供 LLM 在对话中调用完成图像/音频/视频处理等任务。
●🌀 支持全模态生成:TISV(文本、图像、语音、视频)全面打通
不仅支持图像生成,还能进行音频合成、视频渲染、文本转换,实现真正的“多模态交互式创作”。
●🛠 0代码工作流转化:借助 DSL 注解实现参数与输出绑定
用户仅需通过 $参数名.字段名! 的格式在节点标题中添加注解,系统即可自动识别参数类型、是否必填、描述信息,并生成标准 API 工具。
●🧠 与任意大模型对接,兼容 OpenAI / Ollama / Claude 等 Agent 框架
内置 Chainlit UI,可作为 MCP Client 接入 Claude Desktop、Cursor、ChatGPT 等主流模型交互环境,实现视觉功能插件化。
●⚙️ 部署灵活:支持只启用客户端、只启用服务端、或全栈部署
采用 YAML 统一配置,服务可通过 Docker 一键启动,也支持 run.sh 脚本快速启动,适合开发、生产与本地化部署。
●🔧 二次开发易扩展:开箱即用的模块设计 + PEP8 规范代码
代码结构清晰,包括 mcp-base(基础服务)、mcp-server(工作流托管/调度)、mcp-client(前端交互),开发者可方便地自定义拓展节点或新功能。
●🎯 高一致性与安全性设计:参数校验 + 默认值机制 + 节点连接判断
自动检测输出节点(如 SaveImage、SaveVideo),也支持手动标记返回值,确保 LLM 获取结果的一致性与可控性。
●📦 默认提供多个可直接使用的图像生成工作流
如高斯模糊、动漫生图、照片修复等,用户可拖拽即用,也可用作自定义工具模板。
📌三大启发性思考:
AIGC 工具模块化是否正在成为“视觉版 LangChain”?
当任何工作流都能被语言调用,我们是否正进入“对话式视觉编程”时代?
多模态能力是否会成为下一代 Agent 系统的核心竞争力?
Pixelle-MCP 为开发者、设计师与 Agent 工程师提供了一套“低门槛、强可控、高可扩展”的视觉能力构建方案,是通往多模态智能系统的重要基建,特别适合用于 AIGC 插件开发、Agent 增强、AI UI 原型设计等应用场景。
#AI白日梦想家[超话]# #ai创造营# #你好人工智能时代# #ai生活指南# #微博兴趣创作计划#
