OpenAI研发了一种称为sCM(Continuous-Time Consistency Model)的生成方法,能够大幅提升采样速度,相比传统的扩散模型,sCM只需要两步骤采样即可生成高品质样本。研究显示,sCM在生成效率提升约50倍,且样本品质与最佳扩散模型相当,适合用于即时生成应用。
扩散模型已广泛用于生成图片、3D模型、音频和视频,但是传统扩散模型采样过程缓慢,通常需要数十到数百个逐步降噪的过程,才能生成一个高品质样本,因此,这类模型在即时应用和大规模数据生成方面效率很低且难以扩展,虽然现在已经有一些技术能够加快扩散模型的速度,但是通常伴随复杂训练过程,甚至是样本品质下降的副作用。
为了解决扩散模型的既有问题,OpenAI研究团队开发了sCM。sCM这种经过改良的生成模型方法,只需要两个采样步骤即可生成与扩散模型品质相当的高分辨率样本,大幅缩短生成样本的时间。由于sCM可实现约50倍的速度提升,因此特别适合用于即时应用,像是图片、音频和视频生成。
sCM也具有高可扩展性和稳定性,该模型可以处理大规模数据集,并能扩展至拥有15亿参数的模型,而且在该规模下,sCM仍可保持高品质生成效果。sCM训练过程利用预训练扩散模型蒸馏出来的知识,在缩短了采样时间的同时,保持高品质样本生成。
研究人员使用ImageNet 512x512数据集训练的sCM,能够生成细节丰富且高品质的图像,展现其在高分辨率生成方面的能力。虽然sCM只有两个采样步骤,但是生成的样本品质依然可接近最佳扩散模型,研究人员使用FID(Fréchet Inception Distance)分数进行评估,sCM样本品质与需要数百步骤采样的扩散模型相比,差异不到10%。