MIDI(Multi-Instance Diffusion for Single Image to 3D Scene Generation)是一种创新的3D场景生成技术,能够从单张2D图像直接生成具有多个3D实例的完整场景。该技术通过多实例