LTX-2是Lightricks研发的先进AI视频生成模型,专为专业级高质量视频创作打造。该模型可原生输出4K分辨率、50fps帧率的电影级视频,支持文字、图片、草图多模态输入,并提供镜头角度、物体动作、时间节奏等精细化控制能力。
LongCat-Video是美团LongCat团队研发的136亿参数开源AI视频生成模型,支持文本到视频(Text-to-Video)、图像到视频(Image-to-Video)及视频续写(Video-Continuation)全任务流程,核心优势在于高效生成高质量长视频。
Veo 3.1是谷歌推出的旗舰级AI视频生成模型,支持文本提示、图像、视频片段等多模态输入,可直接生成720P、1080P乃至4K高清视频,让用户在生成阶段即可完成音画同步的完整创作,无需额外后期处理。
通义万相2.6是阿里云推出的最新一代AI视频与图像生成模型,于2026年1月正式发布。作为通义万相模型家族的最新版本,它在视频生成和图像创作方面实现了重大突破,是国内首个支持角色扮演功能的视频模型。
Sora 2是OpenAI推出的新一代AI音视频生成模型,该模型实现三大核心技术突破:依托多模态联合训练,首次达成环境音效与画面动态的实时同步生成。
Loopy是由字节跳动和浙江大学的研究团队共同开发的端到端音频驱动的肖像视频生成模型。它通过音频信号生成动态的肖像视频,能够实现音频与视觉内容的同步。