AvatarGO 是一个创新的 4D 人物交互生成和动画框架,它通过零样本方法和大型语言模型(LLM)引导的接触重定向技术,实现了从文本到动画的无缝转换,解决了传统方法在交互位置和方式上的难题。
DynamicCity是一款专注于生成具有语义信息的动态 LiDAR 场景,能够处理大规模空间(80×80×6.4 m³)和长序列(最多 128 帧)的数据。该框架通过在潜空间显式建模场景的空间布局与动态变化,并借助扩散模型直接生成高质量的动态场景。