PhotoDoodle通过其创新的“位置编码克隆”技术和两阶段训练策略,为图像编辑领域带来了新的突破。它不仅能够高效地学习和复制艺术风格,还能在保持背景一致性的前提下,精准地添加装饰元素,为创意表达开辟了全新的可能性。
DynamicCity是一款专注于生成具有语义信息的动态 LiDAR 场景,能够处理大规模空间(80×80×6.4 m³)和长序列(最多 128 帧)的数据。该框架通过在潜空间显式建模场景的空间布局与动态变化,并借助扩散模型直接生成高质量的动态场景。