图像细粒度概念(用图像混合学习更细粒度的特征表示)
图像细粒度概念(用图像混合学习更细粒度的特征表示)
2024-11-22 03:52:19  作者:哭卟葒眼  网址:https://m.xinb2b.cn/sport/yti407759.html

机器之心专栏

机器之心编辑部

这是一篇来自卡耐基梅隆大学和加州伯克利大学 Eric Xing 和 Trevor Darrell 团队联合出品的论文,探究如何在自监督双子结构中通过图像混合学习更加细粒度的特征表示,并入选 AAAI 2022。


论文链接:https://arxiv.org/pdf/2003.05438.pdf代码链接:https://github.com/szq0214/Un-Mix

文章核心思想非常直观易懂:希望去探究在自监督学习常用的双子结构网络中,通过在输入空间做图像融合来学习更加细粒度的特征表示。核心内容讨论了如何来设计数据采样和构建对应的损失函数,从而去匹配图像融合之后新的输入空间

如下图所示,首先形象地解释这一基于图像融合在自监督学习中实现更加细粒度的距离度量的机制


左边示例表示一般常用的双子自监督网络结构的工作原理,它的两个分支的距离就是默认的距离度量,比如使用 InfoNCE 去分类输入的图片对是正对 (positive) 还是负对 (negative)。

右边是本文 Un-Mix 提出的研究思路,即通过在一个分支上做图像融合,使得最后的距离度量变为一个 [0,1] 之间的软化系数


的倍数,从而使两个分支之间的距离变得更加细微和敏感(该工作是首个在自监督双子模型中引入了软距离概念的文章),进而让模型学习到更加细粒度的输入信息的隐空间表达。

实现策略

具体怎么来方便简单地实现这一机制呢?本文作者提出了如下一种策略:通过在一个 mini-batch 内部通过某种顺序做样本融合,从而得到固定的距离度量,如下图所示:


具体地,作者将一个批量(mini-batch)中的样本做一个倒序,然后跟原来的样本们做加权融合,两张原图的距离分别变成为λ和1-λ ,因此一个批量样本集合之间相互的语义距离矩阵变为如下形式:


利用这一新的距离度量,我们可以使用新的损失函数来训练模型,如下所示:


下面是 Un-Mix 算法实现的伪代码:


实验结果

作者在多个数据集上进行了大量的实验。

首先是非 ImageNet 数据集上的训练和测试曲线


可以发现一个比较有趣的现象:在加入了 Un-Mix 之后,训练的损失值(training loss)变得非常不稳定,波动很大,这是因为在输入空间进行图像融合操作之后导致两个分支的距离度量变得更加细微多样和敏感。但是这对模型泛化能力是有帮助的,在做模型测试的时候依然可以取得更好的测试性能。

具体的数值结果对比如下,可以看到在不同数据集和对照方法上结果都有非常明显的提升。


接下来是在 ImageNet 上的结果,文章提出的方法在 200 和 800 epoch 两种不同的的训练参数设置下都有比较稳定的提升:


最后是在下游任务目标检测上的迁移结果,该方法依然有稳定的提升:


此外,作者还讨论了如何处理含有 memory bank 的框架以及如何进行多尺度(multi-scale)训练(如上图 11 所示),有兴趣的同学可以去阅读原论文。

  • 淹城动物园的河马(淹城动物园快要倒闭了)
  • 2024-11-22淹城动物园快要倒闭了网友“alawys”在论坛发帖:我是淹城野生动物园的一名普通职工,至今已在淹野工作8年07年淹野开园的时候,我就加入了这个大家庭,这八年里,我已经把淹野当成了我的第二个家15号是公司固定发工资的日子,。
  • 蔓越莓干的正确吃法(蔓越莓)
  • 2024-11-22蔓越莓#东方甄选#​#董宇辉#​#林区小阿龙#​#蔓越莓#​昨天晚上,东方甄选的董老师为大家推选了一款新产品:蔓越莓原浆网络截图前两天刷抖音看到@林区小阿龙山货3Q5Y介绍蔓越莓,第一次了解到蔓越莓原来是这。
  • 一加氢os11如何更新(体验飙升一加氢OS)
  • 2024-11-22体验飙升一加氢OS北京时间4月7日,一加在前沿艺术中心举办“氢OS成长礼”主题活动,正式发布基于Android6.0操作系统的氢OS1.4极客公园创始人张鹏担任此次活动现场主持,eico联合创始人Rokey、世相创始人。
  • 如何争做时代尖兵(安康34)
  • 2024-11-22安康34陕西农村网-陕西农村报安康讯(通讯员唐纪创)近日,安康好青年的表彰会上,副市长梁志坚蹲下身子,双手给他颁奖安康好青年的表彰会上,副市长梁志坚蹲下身子,双手给王庭德颁奖他就是身高仅有1.16米,被评为“。
  • 猪宝宝什么日子出生好(猪年扎堆生宝宝)
  • 2024-11-22猪年扎堆生宝宝过年那会儿,大年三十户户都在家里团圆,我却待在医院里,陪表妹生孩子过鬼门关事情是这样的,表妹预产期是农历二十六,二十九晚上开始破水上医院医生跟她说孩子有缺氧迹象,建议剖腹产但因为来年是猪年,表妹听人家。
  • 眼镜用纸擦好还是用眼镜布擦好(到底能不能用来擦眼镜)
  • 2024-11-22到底能不能用来擦眼镜就好像老婆饼并不是老婆做的,也不会买饼送老婆,曾经有一段时间,有文章称眼镜布并不是用来擦眼镜的,只是用来包装眼镜放在眼镜盒里缓冲用的,惹得众人惊呼这么多年都误会了眼镜布不过,事实是,眼镜布,真的是用来。
  • 渗透率上升消费者收益(返利刺激价格敏感用户)
  • 2024-11-22返利刺激价格敏感用户快速成长的小平台,也不乏在复合增长上表现突出的应用在对千万级、五百万级MAU应用增速盘点后,我们今天也关注下百万级MAU中增速表现十佳的移动应用,小应用大成长,是新物种的萌发,也可能成长为明日的独角兽。
  • 好看的枪战片战争片电视剧(十部把人看尿的枪战片)
  • 2024-11-22十部把人看尿的枪战片最近这部法国版的《夺命枪火》在国内上映了剧情神马的就跟大家预料的一样,不必多说,但是,枪战场面着实让咖叔震惊了一番不过,咖叔今天想跟大家说的并不是colt45,今天想跟大家聊聊那些影迷们津津乐道的经典。
  • 洛阳牡丹节什么时候欣赏最佳(花开满屏云赏牡丹)
  • 2024-11-22花开满屏云赏牡丹大河报·大河客户端记者段伟朵摄影吴国强疫情防控期间,牡丹花却守约而开今年牡丹文化节的举行,将有啥特点?4月2日上午,河南省人民政府新闻办召开“第38届中国洛阳牡丹文化节”新闻发布会大河报记者从省政府新。
  • 关于宇宙的科普知识有哪些(关于宇宙的20个冷知识)
  • 2024-11-22关于宇宙的20个冷知识当我们注视太空的时候,我们也是在寻找自己的起源,我们的故事就是宇宙的故事,因为我们是恒星真正的孩子注入进我们身体的,每一个原子和分子,就是从宇宙大爆炸到现在,全部的历史1.地球不是平的,但宇宙是平的根。
  • 怎么把系统刷新(提升系统桌面刷新速度技巧)
  • 2024-11-22提升系统桌面刷新速度技巧有些用户的图标还会缓慢一个个显示出来现在我们给大家介绍如何通过修改注册表提升系统桌面刷新速度1、点击“windows”图标,选择“运行”选项,如下图所示:2、输入“regedit”命令,按下“确定”,。
  • 南京野猪从哪里来的(冲击奶茶店的南京野猪到底有多猛)
  • 2024-11-22冲击奶茶店的南京野猪到底有多猛“喂,110吗?一头野猪刚才闯进了奶茶店……”在其他城市的市区报警说看见了野猪,警察可能会怀疑你在报假警,但是在南京则完全不一样南京警方每个月都会接到数十起关于野猪的报警电话,抓捕野猪,成了南京警察的。