ComfyUI-Qwen-TTS是基于阿里巴巴Qwen团队开源项目Qwen3-TTS打造的ComfyUI专用自定义节点集,为ComfyUI提供一站式文本转语音、声音克隆、声音风格设计与多角色对话合成能力,支持高质量、低延迟、多语言的端到端语音生成,可直接嵌入图像/视频工作流使用。
KaniTTS2是AI初创公司NineNineSix正式开源的新一代文本转语音(TTS)模型,专为低延迟、高自然度的实时对话场景量身打造。该模型支持语音克隆、多语言输出,同时提供完整的从零预训练代码框架,助力开发者基于自有数据快速训练定制化TTS模型。
Qwen3-TTS-Flash在语音自然度上实现跨越式升级。通过智能语速韵律调节技术,合成语音能够精准还原真人表达的情绪起伏与语言节奏——无论是娓娓道来的知识讲解,还是情绪饱满的剧情配音,都能传递出细腻的“人味”,彻底告别机械感。