TANGLED 是一种先进的 3D 发型生成技术,能够从任意风格和视角的图像中生成高质量的 3D 发丝。它通过多样化的发型数据集和多视图扩散框架,支持从照片、草图到卡通等多种输入风格,特别擅长处理复杂发型(如卷发和辫子)。
一款由清华大学、北京交通大学和华中科技大学联合推出的多模态视觉定位模型,专门用于自由形式的多图像定位任务。该模型能够根据文本描述、图像或两者的组合,在多幅图像中精确定位相关的视觉区域。