阿里开源的这个工具有意思~！把任意comfyui工作流快速封装成MCP，可以在大语言模型对话中直接调用！Pixelle-MCP：基于 ComfyUI + MCP + LLM 的开源多模态 AIGC 解决方案🧐一句话总结：Pixelle-MCP 实现了 ComfyUI 工作流向 LLM 可调用工具的自动转化，支持文本、图像、语音、视频等全模态内容生成

阿里开源的这个工具有意思~！把任意comfyui工作流快速封装成MCP，可以在大语言模型对话中直接调用！
Pixelle-MCP：基于 ComfyUI + MCP + LLM 的开源多模态 AIGC 解决方案
🧐一句话总结：Pixelle-MCP 实现了 ComfyUI 工作流向 LLM 可调用工具的自动转化，支持文本、图像、语音、视频等全模态内容生成，构建了一个“0代码开发多模态 Agent 工具链”的强大框架，让 AIGC 能力以插件化方式接入任意大模型或 Agent 系统。
➡️链接：http://t.cn/A6FlU0pZ
✨重点

●🧩 核心机制：一套工作流 = 一个 MCP Tool = LLM 可用能力

通过 ComfyUI 画布构建的工作流，Pixelle-MCP 可自动解析其节点逻辑与参数需求，将其封装为标准 MCP 工具，供 LLM 在对话中调用完成图像/音频/视频处理等任务。
●🌀 支持全模态生成：TISV（文本、图像、语音、视频）全面打通

不仅支持图像生成，还能进行音频合成、视频渲染、文本转换，实现真正的“多模态交互式创作”。
●🛠 0代码工作流转化：借助 DSL 注解实现参数与输出绑定

用户仅需通过 $参数名.字段名! 的格式在节点标题中添加注解，系统即可自动识别参数类型、是否必填、描述信息，并生成标准 API 工具。
●🧠 与任意大模型对接，兼容 OpenAI / Ollama / Claude 等 Agent 框架

内置 Chainlit UI，可作为 MCP Client 接入 Claude Desktop、Cursor、ChatGPT 等主流模型交互环境，实现视觉功能插件化。
●⚙️ 部署灵活：支持只启用客户端、只启用服务端、或全栈部署

采用 YAML 统一配置，服务可通过 Docker 一键启动，也支持 run.sh 脚本快速启动，适合开发、生产与本地化部署。
●🔧 二次开发易扩展：开箱即用的模块设计 + PEP8 规范代码

代码结构清晰，包括 mcp-base（基础服务）、mcp-server（工作流托管/调度）、mcp-client（前端交互），开发者可方便地自定义拓展节点或新功能。
●🎯 高一致性与安全性设计：参数校验 + 默认值机制 + 节点连接判断

自动检测输出节点（如 SaveImage、SaveVideo），也支持手动标记返回值，确保 LLM 获取结果的一致性与可控性。
●📦 默认提供多个可直接使用的图像生成工作流

如高斯模糊、动漫生图、照片修复等，用户可拖拽即用，也可用作自定义工具模板。
📌三大启发性思考：
AIGC 工具模块化是否正在成为“视觉版 LangChain”？
当任何工作流都能被语言调用，我们是否正进入“对话式视觉编程”时代？
多模态能力是否会成为下一代 Agent 系统的核心竞争力？
Pixelle-MCP 为开发者、设计师与 Agent 工程师提供了一套“低门槛、强可控、高可扩展”的视觉能力构建方案，是通往多模态智能系统的重要基建，特别适合用于 AIGC 插件开发、Agent 增强、AI UI 原型设计等应用场景。

#AI白日梦想家[超话]# #ai创造营# #你好人工智能时代# #ai生活指南# #微博兴趣创作计划#

发布于广西