Lumiere是谷歌研究院研发的时空文本到视频扩散模型,核心创新在于采用空间时间U-Net架构——摒弃传统模型逐帧合成的模式,通过单次传递即可生成视频的完整时间序列,从根源上保障视频的全局时间一致性与画面逼真度,赋能多元内容创作与视频编辑任务。