介绍

扩散模型(Diffusion Model, DM)是图像生成模型的一种,有别于大名鼎鼎的GAN、VAE的图像生成模型,扩散模型另辟蹊径。扩散模型的主要思想是先对图像增加噪声,再逐步去噪的过程。其中如何去噪还原图像是扩散模型的核心部分。经过训练扩散模型最终能够从一张随机的噪声图像中生成图像。

和GAN的对比

目前所采用的扩散模型大都是来自于2020年的工作DDPM: Denoising Diffusion Probabilistic Models。和生成对抗网络(GAN)相比,DDPM拟合的是加噪图像,并通过反向过程(去噪)生成原始图像,而GAN是通过判别器拟合原始图像,和DDPM有本质的区别。

具体来说,GAN模型通过使得生成器生成的图像尽可能逼近真实图像,从而达到以假乱真的目的,本质上还是去生成和真实图像接近的新图像。而DDPM是拟合整个从真实图像到随机高斯噪声的过程,再通过反向过程生成新的图像。在这一点上DDPM和GAN有着本质的不同。