一款基于Llama-3b架构的开源AI语音合成系统——Orpheus TTS

Orpheus TTS 是一款基于 Llama-3b 架构的开源文本到语音(TTS)系统,能够生成接近人类水平的自然语音,支持情感和语调引导,具备零样本语音克隆能力。它提供低延迟的实时流式推理,支持多种预设语音风格。

AI语音克隆AI语音合成
Octave:Hume AI 推出的情感语音合成引擎,开启文本转语音的新纪元

Octave是由 Hume AI 开发的革命性文本转语音系统,能够理解情感、上下文和个性特征,生成自然流畅且富有情感的语音输出。它支持即时语音克隆、多角色对话和个性化语音调整,广泛应用于影视、游戏、教育和客服等领域。

AI语音克隆Hume AI文本转语音
Llasa TTS:香港科技大学开发的文本到语音模型,专注于实现极致的语音克隆效果

Llasa TTS 是一款由香港科技大学开发的先进文本到语音(TTS)模型,基于 LLaMA 微调,专注于生成超真实的语音克隆效果。它支持中英双语,能够生成带有情感色彩的语音,并通过仅需15秒的声音样本实现高度准确的声音克隆。

AI语音克隆文本转语音香港科技大学