时序预测机器学习(SoftDiffusion谷歌新框架从通用扩散中正确调度)
时序预测机器学习(SoftDiffusion谷歌新框架从通用扩散中正确调度)
2024-09-28 10:13:09  作者:他说全是爱  网址:https://m.xinb2b.cn/tech/vpp317840.html

选自arXiv

机器之心编译

编辑:蛋酱

近来,扩散模型成为 AI 领域的研究热点。谷歌研究院和 UT-Austin 的研究者在最新的一项研究中充分考虑了「损坏」过程,并提出了一个用于更通用损坏过程的扩散模型设计框架。

我们知道,基于分数的模型和去噪扩散概率模型(DDPM)是两类强大的生成模型,它们通过反转扩散过程来产生样本。这两类模型已经在 Yang Song 等研究者的论文《Score-based generative modeling through stochastic differential equations》中统一到了单一的框架下,并被广泛地称为扩散模型。

目前,扩散模型在包括图像、音频、视频生成以及解决逆问题等一系列应用中取得了巨大的成功。Tero Karras 等研究者在论文《Elucidating the design space of diffusionbased generative models》中对扩散模型的设计空间进行了分析,并确定了 3 个阶段,分别为 i) 选择噪声水平的调度,ii) 选择网络参数化(每个参数化生成一个不同的损失函数),iii) 设计采样算法。

近日,在谷歌研究院和 UT-Austin 合作的一篇 arXiv 论文《Soft Diffusion: Score Matching for General Corruptions》中,几位研究者认为扩散模型仍有一个重要的步骤:损坏(corrupt)。一般来说,损坏是一个添加不同幅度噪声的过程,对于 DDMP 还需要重缩放。虽然有人尝试使用不同的分布来进行扩散,但仍缺乏一个通用的框架。因此,研究者提出了一个用于更通用损坏过程的扩散模型设计框架。

具体地,他们提出了一个名为 Soft Score Matching 的新训练目标和一种新颖的采样方法 Momentum Sampler。理论结果表明,对于满足正则条件的损坏过程,Soft Score MatchIng 能够学习它们的分数(即似然梯度),扩散必须将任何图像转换为具有非零似然的任何图像。

在实验部分,研究者在 CelebA 以及 CIFAR-10 上训练模型,其中在 CelebA 上训练的模型实现了线性扩散模型的 SOTA FID 分数——1.85。同时与使用原版高斯去噪扩散训练的模型相比,研究者训练的模型速度显著更快。


论文地址:https://arxiv.org/pdf/2209.05442.pdf

方法概览

通常来说,扩散模型通过反转逐渐增加噪声的损坏过程来生成图像。研究者展示了如何学习对涉及线性确定性退化和随机加性噪声的扩散进行反转。


具体地,研究者展示了使用更通用损坏模型训练扩散模型的框架,包含有三个部分,分别为新的训练目标 Soft Score Matching、新颖采样方法 Momentum Sampler 和损坏机制的调度。

首先来看训练目标 Soft Score Matching,这个名字的灵感来自于软过滤,是一种摄影术语,指的是去除精细细节的过滤器。它以一种可证明的方式学习常规线性损坏过程的分数,还在网络中合并入了过滤过程,并训练模型来预测损坏后与扩散观察相匹配的图像。

只要扩散将非零概率指定为任何干净、损坏的图像对,则该训练目标可以证明学习到了分数。另外,当损坏中存在加性噪声时,这一条件总是可以得到满足。

具体地,研究者探究了如下形式的损坏过程。


在过程中,研究者发现噪声在实证(即更好的结果)和理论(即为了学习分数)这两方面都很重要。这也成为了其与反转确定性损坏的并发工作 Cold Diffusion 的关键区别。

其次是采样方法 Momentum Sampling。研究者证明,采样器的选择对生成样本质量具有显著影响。他们提出了 Momentum Sampler,用于反转通用线性损坏过程。该采样器使用了不同扩散水平的损坏的凸组合,并受到了优化中动量方法的启发。

这一采样方法受到了上文 Yang Song 等人论文提出的扩散模型连续公式化的启发。Momentum Sampler 的算法如下所示。


下图直观展示了不同采样方法对生成样本质量的影响。图左使用 Naive Sampler 采样的图像似乎有重复且缺少细节,而图右 Momentum Sampler 显著提升了采样质量和 FID 分数。


最后是调度。即使退化的类型是预定义的(如模糊),决定在每个扩散步骤中损坏多少并非易事。研究者提出一个原则性工具来指导损坏过程的设计。为了找到调度,他们将沿路径分布之间的 Wasserstein 距离最小化。直观地讲,研究者希望从完全损坏的分布平稳过渡到干净的分布。

实验结果

研究者在 CelebA-64 和 CIFAR-10 上评估了提出的方法,这两个数据集都是图像生成的标准基线。实验的主要目的是了解损坏类型的作用。

研究者首先尝试使用模糊和低幅噪声进行损坏。结果表明,他们提出的模型在 CelebA 上实现了 SOTA 结果,即 FID 分数为 1.85,超越了所有其他仅添加噪声以及可能重缩放图像的方法。此外在 CIFAR-10 上获得的 FID 分数为 4.64,虽未达到 SOTA 但也具有竞争力。


此外,在 CIFAR-10 和 CelebA 数据集上,研究者的方法在另一项指标采样时间上也表现更好。另一个额外的好处是具有显著的计算优势。与图像生成去噪方法相比,去模糊(几乎没有噪声)似乎是一种更有效的操纵。

下图展示了 FID 分数如何随着函数评估数量(Number of Function Evaluations, NFE)而变。从结果可以看到,在 CIFAR-10 和 CelebA 数据集上,研究者的模型可以使用明显更少的步骤来获得与标准高斯去噪扩散模型相同或更好的质量。


  • 琅琊榜谢玉那段没看懂(谢玉到死都不会承认)
  • 2024-09-29谢玉到死都不会承认景睿的生日宴上,谢玉的真实面目被揭开了,就在他准备将大家赶尽杀绝时,誉王和言候恰到好处地出现在谢府门口巡防营的头目招架不住这两位大佬的想要冲进谢府的决心,这时,谢玉只好从里面赶过来阻拦谢玉不让步,言候。
  • 重庆大学弘深学院怎么申请(重庆大学成立弘深书院)
  • 2024-09-29重庆大学成立弘深书院来源:【科学网】揭牌仪式重庆大学供图6月29日,重庆大学弘深书院成立仪式暨书院院长聘任仪式在该校举行重庆大学校长、中国工程院院士王树新和中国工程院院士、弘深书院院长周绪红共同为弘深书院揭牌“弘深书院”。
  • 北汽幻速s7测评(三四五线城市二胎家庭又多了个选择)
  • 2024-09-29三四五线城市二胎家庭又多了个选择文|李一帆图|PR一个月前,北汽幻速上市了款旗舰车型——幻速S7,一辆中型SUV,全系采用7座布局,指导价7.88万~11.58万元一个月后,我摸到了这款车其实一直觉得,从各种角度来说,北汽幻速都是个。
  • 古代压箱底10大名画
  • 2024-09-29古代压箱底10大名画回答:古代十大名画:1、《洛神赋图》一东晋顾恺之画作2、《清明上河图》一北宋画家张作端3、《富春山居图》一元代画家黄公望4、《汉宫春晓图》一明代画家仇英5、《百骏图》一意大利籍清代宫廷画家郎世宁6、《。
  • 重庆大巴掉入江(重庆一大巴车坠入长江)
  • 2024-09-29重庆一大巴车坠入长江重庆万州长江二桥一大巴车与轿车相撞后冲入长江伤亡暂时不明记者从重庆市交巡警总队获悉,10月28日上午,重庆万州区长江二桥上发生一起交通事故,一辆大巴车与一辆轿车相撞后,冲破护栏掉入长江目前尚不清楚大巴。
  • 次北固亭原文及简单翻译(了解一下)
  • 2024-09-29了解一下原文:《永遇乐·京口北固亭怀古》千古江山,英雄无觅,孙仲谋处舞榭歌台,风流总被,雨打风吹去斜阳草树,寻常巷陌人道寄奴曾住想当年,金戈铁马,气吞万里如虎  元嘉草草,封狼居胥,赢得仓皇北顾四十三年,望中。
  • 华为手机热点密码怎么查看(华为手机热点密码如何查看)
  • 2024-09-29华为手机热点密码如何查看在首页中点击华为手机设置功能进入设置后,在设置中点击无线和网络在无线和网络中点击无线网络共享再点击便携式wlan热点进入到wlan热点中后,点击配置wlan热点点击打开,然后可以看到下面的热点密码密文。
  • 一根头发引发的出轨电影(这部讲出轨的电影)
  • 2024-09-29这部讲出轨的电影大家好,这里是文学曲线分享好书、好片和有趣的文史知识♥喜欢就关注一下吧♥前段时间,有一部讲“出轨”的韩国电视剧频上热搜,但与热度不同的是,许多网友都认为这个作品的三观不正,表示看得很糟心事实上所有和“。
  • 满天星花如何养(怎么养好满天星)
  • 2024-09-29怎么养好满天星满天星喜温暖湿润和阳光充足环境,较耐阴,耐寒,在排水良好、肥沃和疏松的壤土中生长最好栽培土质以微碱性的石灰质壤土为佳,排水、日照需良好植株高度已有20厘米以上,灌水量酌量减少,稍干旱能促进开花,尤其开。
  • 北斗七星哪一个是北斗星(北斗七星是哪七颗)
  • 2024-09-29北斗七星是哪七颗在夜空中,只有仙女座星系、三角座星系以及大、小麦哲伦星云这四个呈现出云雾状的天体是肉眼可见的河外星系,其他肉眼可见的星星都是在银河系之内,并且它们与地球相距大都不超过1000光年(银河系半径5万光年)。
  • 天猫入驻后怎么运营好(全套运营PPT该怎么做呢)
  • 2024-09-29全套运营PPT该怎么做呢其他人说过的一些,比如做PPT需要,公司介绍,产品定位等等这些,我就不说了,这里只说一些他们不知道和不愿意说的前言,自己去申请入驻天猫,或者找玩概率的代入驻去代办申请,都是需要PPT运营计划书的,来用。
  • 6at和湿式双离合怎么选(为什么开习惯湿式双离合的车)
  • 2024-09-29为什么开习惯湿式双离合的车一旦开多了大众DSG、奥迪的湿式双离合车型,或者是自主一线品牌的吉利、长城、奇瑞的湿式双离合中高端车,然后再也不愿意去驾驶搭载爱信6AT甚至8AT的车,尽管爱信AT系列变速箱名声在外,只要驾驶如今的湿。