ComfyUI DiffSynth Studio Wrapper是一款轻量级自定义节点封装器,核心目标是将DiffSynth-Studio的Z-Image I2L功能,无缝嵌入ComfyUI可视化工作流。借助该节点,用户无需进行外部模型训练或微调,即可直接从参考图像快速生成临时LoRA,并立即应用于新图像采样,高效实现风格、角色的精准迁移与视觉一致性保持。
ComfyUI-Grok-SmartVAE是面向LTX-Video、Stable Video Diffusion、CogVideoX、AnimateDiff等主流长视频序列模型打造的专用VAE解码器,也是当前ComfyUI生态里稳定性最强、扩展性最灵活的解码方案。
TADA的核心目标是打开AI音乐模型的”黑盒”,定位控制各类音乐属性的独立”开关”,让用户像调节音响旋钮一样,对速度、情绪、音色等维度进行精准、解耦的细粒度控制。
ComfyUI AudioSR是专为ComfyUI打造的原生音频超分辨率处理节点,基于先进的潜在扩散模型AudioSR研发,核心能力是将任意低质量音频(低采样率、低码率)上采样至48kHz标准音质,同时精准增强高频细节、修复压缩失真问题,实现音频清晰度、饱满度的显著提升,完美适配ComfyUI音频处理工作流。
ComfyUI-Cinematic-Prompt是ComfyUI专属可视化提示词构建工具,原生适配Midjourney、Stable Diffusion、Nanobanana pro、Flux等主流生成工作流,同时完美支持文生图、图生图两大核心场景,让电影化提示词搭建更直观、更高效。
ComfyUI-Yedp-Action-Director与常规静态图像加载器不同,Yedp Action Director基于Three.js技术,所有渲染操作均在客户端(用户浏览器内)完成,渲染结束后会自动将像素数据回传至ComfyUI,无缝衔接后续处理流程,彻底打破“3D预览-渲染-导入”的割裂感,大幅提升工作流的连贯性与整体效率。
SoulX-Singer是由SoulAI-Lab研发的高保真零样本歌声合成模型,仅需3–10秒参考音频,即可快速克隆任意人声,生成自然、富有情感表现力的演唱音频。
ComfyUI-SoulX-Podcast是面向ComfyUI打造的专用播客生成节点插件,将SoulX-Podcast长文本、多说话人、多方言播客合成能力封装为可视化工作流,支持通过简易脚本与参考音频快速克隆音色,一键产出高质量播客音频。
OpenClaw是GitHub 100,000+ Stars的开源个人AI助手平台。它运行在你的电脑上,通过WhatsApp、Telegram、Discord等聊天应用与你的AI助手交互,帮你处理邮件、日历、文件等日常事务。
MagicEdit是字节跳动推出的一款智能视频编辑工具,核心技术亮点在于精准区分视频的外观与动作特征,实现高保真度、时间连贯性的视频编辑,让用户对视频内容和流畅度的控制达到更精细的级别。
HandRefiner提出一种针对性图像后处理方法,核心目标是在完全保留图像其他部分原貌的前提下,精准修正生成图像中形状异常的手部。
OOTDiffusion是一款基于潜在扩散模型打造的高度可控开源虚拟试穿工具,支持根据不同性别、体型自动适配服装版型,实现服装与模特的精准贴合;同时支持自定义参数调整试穿效果,提供半身、全身双模型模式,满足多样化试穿需求。