FlowAct-R1:字节跳动推出的实时交互数字人视频生成框架

FlowAct-R1是字节跳动推出的实时交互数字人视频生成框架,该框架凭借分块扩散强制策略、多模态大语言模型等核心技术,实现1.5秒首帧低延迟与25fps稳定实时响应,可精细调控数字人面部表情和肢体动作。

字节跳动框架数字人视频视频生成框架