时序预测机器学习(SoftDiffusion谷歌新框架从通用扩散中正确调度)
时序预测机器学习(SoftDiffusion谷歌新框架从通用扩散中正确调度)
2024-10-01 02:24:30  作者:他说全是爱  网址:https://m.xinb2b.cn/know/vpp317840.html

选自arXiv

机器之心编译

编辑:蛋酱

近来,扩散模型成为 AI 领域的研究热点。谷歌研究院和 UT-Austin 的研究者在最新的一项研究中充分考虑了「损坏」过程,并提出了一个用于更通用损坏过程的扩散模型设计框架。

我们知道,基于分数的模型和去噪扩散概率模型(DDPM)是两类强大的生成模型,它们通过反转扩散过程来产生样本。这两类模型已经在 Yang Song 等研究者的论文《Score-based generative modeling through stochastic differential equations》中统一到了单一的框架下,并被广泛地称为扩散模型。

目前,扩散模型在包括图像、音频、视频生成以及解决逆问题等一系列应用中取得了巨大的成功。Tero Karras 等研究者在论文《Elucidating the design space of diffusionbased generative models》中对扩散模型的设计空间进行了分析,并确定了 3 个阶段,分别为 i) 选择噪声水平的调度,ii) 选择网络参数化(每个参数化生成一个不同的损失函数),iii) 设计采样算法。

近日,在谷歌研究院和 UT-Austin 合作的一篇 arXiv 论文《Soft Diffusion: Score Matching for General Corruptions》中,几位研究者认为扩散模型仍有一个重要的步骤:损坏(corrupt)。一般来说,损坏是一个添加不同幅度噪声的过程,对于 DDMP 还需要重缩放。虽然有人尝试使用不同的分布来进行扩散,但仍缺乏一个通用的框架。因此,研究者提出了一个用于更通用损坏过程的扩散模型设计框架。

具体地,他们提出了一个名为 Soft Score Matching 的新训练目标和一种新颖的采样方法 Momentum Sampler。理论结果表明,对于满足正则条件的损坏过程,Soft Score MatchIng 能够学习它们的分数(即似然梯度),扩散必须将任何图像转换为具有非零似然的任何图像。

在实验部分,研究者在 CelebA 以及 CIFAR-10 上训练模型,其中在 CelebA 上训练的模型实现了线性扩散模型的 SOTA FID 分数——1.85。同时与使用原版高斯去噪扩散训练的模型相比,研究者训练的模型速度显著更快。


论文地址:https://arxiv.org/pdf/2209.05442.pdf

方法概览

通常来说,扩散模型通过反转逐渐增加噪声的损坏过程来生成图像。研究者展示了如何学习对涉及线性确定性退化和随机加性噪声的扩散进行反转。


具体地,研究者展示了使用更通用损坏模型训练扩散模型的框架,包含有三个部分,分别为新的训练目标 Soft Score Matching、新颖采样方法 Momentum Sampler 和损坏机制的调度。

首先来看训练目标 Soft Score Matching,这个名字的灵感来自于软过滤,是一种摄影术语,指的是去除精细细节的过滤器。它以一种可证明的方式学习常规线性损坏过程的分数,还在网络中合并入了过滤过程,并训练模型来预测损坏后与扩散观察相匹配的图像。

只要扩散将非零概率指定为任何干净、损坏的图像对,则该训练目标可以证明学习到了分数。另外,当损坏中存在加性噪声时,这一条件总是可以得到满足。

具体地,研究者探究了如下形式的损坏过程。


在过程中,研究者发现噪声在实证(即更好的结果)和理论(即为了学习分数)这两方面都很重要。这也成为了其与反转确定性损坏的并发工作 Cold Diffusion 的关键区别。

其次是采样方法 Momentum Sampling。研究者证明,采样器的选择对生成样本质量具有显著影响。他们提出了 Momentum Sampler,用于反转通用线性损坏过程。该采样器使用了不同扩散水平的损坏的凸组合,并受到了优化中动量方法的启发。

这一采样方法受到了上文 Yang Song 等人论文提出的扩散模型连续公式化的启发。Momentum Sampler 的算法如下所示。


下图直观展示了不同采样方法对生成样本质量的影响。图左使用 Naive Sampler 采样的图像似乎有重复且缺少细节,而图右 Momentum Sampler 显著提升了采样质量和 FID 分数。


最后是调度。即使退化的类型是预定义的(如模糊),决定在每个扩散步骤中损坏多少并非易事。研究者提出一个原则性工具来指导损坏过程的设计。为了找到调度,他们将沿路径分布之间的 Wasserstein 距离最小化。直观地讲,研究者希望从完全损坏的分布平稳过渡到干净的分布。

实验结果

研究者在 CelebA-64 和 CIFAR-10 上评估了提出的方法,这两个数据集都是图像生成的标准基线。实验的主要目的是了解损坏类型的作用。

研究者首先尝试使用模糊和低幅噪声进行损坏。结果表明,他们提出的模型在 CelebA 上实现了 SOTA 结果,即 FID 分数为 1.85,超越了所有其他仅添加噪声以及可能重缩放图像的方法。此外在 CIFAR-10 上获得的 FID 分数为 4.64,虽未达到 SOTA 但也具有竞争力。


此外,在 CIFAR-10 和 CelebA 数据集上,研究者的方法在另一项指标采样时间上也表现更好。另一个额外的好处是具有显著的计算优势。与图像生成去噪方法相比,去模糊(几乎没有噪声)似乎是一种更有效的操纵。

下图展示了 FID 分数如何随着函数评估数量(Number of Function Evaluations, NFE)而变。从结果可以看到,在 CIFAR-10 和 CelebA 数据集上,研究者的模型可以使用明显更少的步骤来获得与标准高斯去噪扩散模型相同或更好的质量。


  • 庆余年人物关系(庆余年里复杂的人际关系)
  • 2024-10-01庆余年里复杂的人际关系火热播出的《庆余年》在这个寒冷的冬季给了观众慢慢的期待,尤其是到了新的一周,对新的更新望眼欲穿范闲母亲给他留下的箱子终于要打开了,想来一定很震撼当然网络上的剧透很多,相信大家也都猜得差不多了但是今天咱。
  • 宗族和氏族有什么不同(宗族什么是大宗)
  • 2024-10-01宗族什么是大宗什么是大宗和小宗?《仪礼·丧服》:“为人后者孰后?后大宗也曷为后大宗?大宗者,尊之统也”周代设立宗法制后,以嫡系长房为“大宗”,余子为“小宗”并有“百世不迁之宗者,谓大宗也,云有五世则迁之宗者,谓小宗。
  • 以期待落空写一篇作文150字(请以寻路开路)
  • 2024-10-01请以寻路开路任务三【聚焦时代一一探寻世界融通梦】(8分)(4)有史以来,人类从未停止探寻世界的脚步,在不断的交往交流中,世界的大门徐徐打开请以“寻路・开路”为题,写一篇150字左右的小短文(从下面的关键词中任三个。
  • 专业吃蟹方法(吃螃蟹的正确方法)
  • 2024-10-01吃螃蟹的正确方法掀掉蟹壳:根据自己的口味和喜好,挑选公/母蟹,取出煮熟的螃蟹,待晾干后,用手掰开蟹的壳去蟹脐:将蟹翻身,将螃蟹的蟹脐掰除,因为蟹脐中有蟹肠都是脏东西,不能食用,即使是母蟹的蟹脐中有一些黄,如若手法不当。
  • 曹国伟有没有微博(曹国伟以微博之力)
  • 2024-10-01曹国伟以微博之力(作者:曹国伟新浪集团董事长兼首席执行官、微博董事长)从迈入3G、拥抱4G,到畅通5G,我国移动互联网高速发展,“互联网”和技术赋能的观念深入人心,网络传播方式更加多元,人们的内容消费习惯也更加碎片化。
  • 什么牌子的帐篷好一点(不得不知的帐篷十大品牌)
  • 2024-10-01不得不知的帐篷十大品牌选择一顶适宜的帐篷会增添露营的舒适度,了解这些帐篷品牌可以给你提供一些建议哦~01牧高笛MOBIGARDEN价格:300~6000,产品线齐全2003年做帐篷起家的国产品牌,以“露营专业主义”为理念,。
  • 2022年1月新书排行榜(15种新书速递2022年第26期)
  • 2024-10-0115种新书速递2022年第26期1.《我知道的杨振宁》葛墨林口述并审定金鑫整理ISBN:978-7-100-21430-8定价:58.00元内容简介:著名物理学家、中科院院士葛墨林从20世纪70年代末结识杨振宁先生,80年代多次赴美。
  • 王者荣耀里可以赠送钻石吗(有详细的说明吗)
  • 2024-10-01有详细的说明吗王者荣耀里不可以赠送钻石钻石在王者荣耀里面可以通过武道大会,系统停服补偿等方式获得钻石可以用来购买英雄(鲁班七号,廉颇,庄周,刘禅,典韦),也可以用钻石抽奖,钻石抽奖可以获得韩信,第201次必得王者荣。
  • 游戏里的jjc是什么意思(这个YJJC太让人猝不及防)
  • 2024-10-01这个YJJC太让人猝不及防现在网络中的内涵词可谓是玩出了花,纯数字组合和纯字母组合,那就是玩儿,哎,就是玩儿小编也不卖关子,先上几个给大伙猜猜看1、SKSK可不是代表SKII的神仙水哦,其实啊,它是“生日快乐”的缩写,SK=生。
  • 蛤蟆仙人第4次忍界大战(自奈落被消灭之后)
  • 2024-10-01自奈落被消灭之后在看完最新一集的半妖的夜叉姬之后,笔者当时第一个反应就是看了个寂寞,然后是黑脸问号,虽然一直是打斗场面,但这毫无紧张感的剧情,以及穷奇脖子上的铃铛,不知道大家要有没有感受得到他们的“燃”,反正笔者在看。
  • 贾乃亮最近怎么不直播带货了(都是套路贾乃亮说)
  • 2024-10-01都是套路贾乃亮说提到贾乃亮,真的是一言难尽,作为演员,拿的出手的作品没几个,近几年更是一个作品都没有各种各样的综艺倒是不少,对于直播带货无疑是成功的,可以说是有一些天赋的贾乃亮在一次节目中提到直播带货,他为什么去做直。