Seedance 1.5 Pro是字节跳动Seed团队研发的原生音画同步多模态视频生成模型,支持通过文本指令生成高质量视频内容,覆盖多语言、多方言及多样人声与音效。
Vidi2是字节跳动推出的专注于视频理解与创作的多模态大语言模型,模型可基于文本查询,精准识别视频对应时间戳并标记目标对象边界框,还创新引入VUE-STG、VUE-TR-V2两大基准测试,为STG能力评估提供更科学的标准。
Wan2.5-Preview是阿里巴巴推出的新一代多模态生成模型,集成文生视频、图生视频、文生图、图像编辑四大核心功能,突破性实现音画同步的视频生成能力,支持1080P高清分辨率、24fps流畅帧率创作。