SoulX-LiveAct模型官网 - Soul App开源实时数字人流式生成框架

支持小时级乃至无限时长生成;双卡H100/H200即可实现20FPS实时推理,延迟低至0.94秒,可直接落地直播、虚拟客服、有声播客等生产场景,标志开源数字人技术迈入实用化新阶段。

Soul App开源数字人生成框架
SoulX-FlashTalk:Soul App开源14B实时数字人生成模型,亚秒级延迟赋能商业级数字人应用

SoulX-FlashTalk是Soul App旗下AI团队开源的首款14B参数实时数字人生成模型,实现0.87秒亚秒级延迟、32fps高帧率输出,凭借双向流式蒸馏与多步自纠正核心机制,达成无限时长稳定生成、全身动作交互及多语言驱动能力。

Soul App开源数字人生成框架
OmniHuman:字节推出的一款端到端的多模态数字人视频生成框架

OmniHuman是字节跳动推出的端到端多模态数字人视频生成框架,上传1张静态照片+音频即可实时合成高自然度说话唱歌视频,支持全身、半身、卡通任意比例输入,口型误差<0.1秒,可一键下载,面向虚拟主播、短视频、影视动画、在线教育、游戏NPC等场景开放体验。

字节跳动框架数字人生成框架视频生成框架