Dia AI:一款拥有1.6亿参数,Nari Labs研发的轻量级文本到语音AI模型

Dia AI模型支持情感与语调精准控制,还能生成笑声、咳嗽等非言语交流音效,预训练模型权重托管于Hugging Face平台,目前适配英语语音生成,是推动对话生成技术发展的重要工具,可免费用于研究与教育场景。

AI文本到语音AI语音克隆语音AI模型
NVIDIA PersonaPlex:英伟达推出的一款全双工对话AI模型

NVIDIA PersonaPlex是英伟达推出的全双工对话AI模型,核心优势在于具备“同时听和说”的实时交互能力,可自然处理对话中的打断、停顿与即时回应。

英伟达语音AI模型