ComfyUI-AudioX模型插件入口,多模态音频生成框架AudioX开发的专属自定义节点

ComfyUI-AudioX是基于香港科技大学全新多模态音频生成框架AudioX开发的专属自定义节点,核心实现视频内容→高度同步音效/背景音乐的自动生成,同时支持文本提示词精准精细化引导,可无缝接入ComfyUI现有工作流,彻底解决视频音频同步生成难、适配性差的痛点,为视频创作提供高效、专业的音频赋能。

ComfyUI专属节点ComfyUI安装音频生成模型AI香港科技大学
PosterCraft:一款用于生成高质量美学海报的AI框架

PosterCraft是由香港科技大学(广州)联合美团等机构推出的一款用于生成高质量美学海报的统一框架。它摒弃了传统的模块化设计流程和固定的预定义布局,支持模型自由探索连贯且视觉上引人入胜的构图。

AI框架AI海报生成美团AI香港科技大学
Llasa TTS:香港科技大学开发的文本到语音模型,专注于实现极致的语音克隆效果

Llasa TTS 是一款由香港科技大学开发的先进文本到语音(TTS)模型,基于 LLaMA 微调,专注于生成超真实的语音克隆效果。它支持中英双语,能够生成带有情感色彩的语音,并通过仅需15秒的声音样本实现高度准确的声音克隆。

AI语音克隆文本转语音香港科技大学