ComfyUI-CacheDiT是专为ComfyUI设计的DiT模型一键加速插件,通过智能缓存技术,为Z-Image、Qwen-Image、LTX‑2等主流DiT模型提供1.4–2.0倍推理加速,且几乎不损失图像与视频生成质量。插件零配置、开箱即用,完美解决DiT模型推理慢的痛点,让新手也能轻松获得高效生成体验。
ComfyUI-AceMusic是基于ACE-Step 1.5打造的ComfyUI专业音乐生成自定义节点,专注实现多语种、带歌词、完整歌曲一键生成,支持中文、英文、日文、韩文等19种语言。插件将ACE-Step1.5核心能力完整封装为节点化工作流,兼顾本地部署与生产级音乐创作需求,开箱即用、稳定高效。
ComfyUI-VideoMaMa通过自定义节点,即可在ComfyUI原生界面中,可视化操控VideoMaMa的全部核心能力。从视频加载、遮罩生成,到抠图推理,全程一键式操作、拖拽式完成;同时集成SAM2模型,实现交互式遮罩生成,哪怕是零基础用户,也能轻松做出专业级视频抠图效果,彻底打破“视频抠图门槛高、操作复杂”的壁垒。
ComfyUI-Youtu-VL插件是专为腾讯40亿参数轻量级视觉语言模型(Youtu-VL)打造的ComfyUI自定义节点插件,适配Youtu-VL模型的全量视觉任务,包括视觉定位、图像分割、深度估计、姿态估计等。
ComfyUI Prompt Helper的核心亮点的是对Qwen3-4B-Z-Image-Engineer模型的深度集成,专为Z-Image、Qwen Image等当前主流图像模型优化提示词结构,核心聚焦正向约束强化、纹理细节补充、电影级相机参数适配,帮用户快速将简单描述转化为高密度、结构化的专业提示词,大幅提升图像生成精度与质感,无缝适配ComfyUI原生工作流。
ComfyUI-Qwen-TTS是基于阿里巴巴Qwen团队开源项目Qwen3-TTS打造的ComfyUI专用自定义节点集,为ComfyUI提供一站式文本转语音、声音克隆、声音风格设计与多角色对话合成能力,支持高质量、低延迟、多语言的端到端语音生成,可直接嵌入图像/视频工作流使用。