cnn做图像分类详解(给CNN平移不变性同时提升ImageNet成绩)
cnn做图像分类详解(给CNN平移不变性同时提升ImageNet成绩)
2024-11-22 05:47:28  作者:哗众取宠  网址:https://m.xinb2b.cn/life/ftb223314.html

栗子 发自 凹非寺

量子位 报道 | 公众号 QbitAI


古往今来,大家都知道:只要图像一平移,CNN就认不出来了

原因就在降采样身上。不管是最大池化,跨步卷积,还是平均池化,都对平移太敏感:

比如,0、0、1、1、0、0、1、1……这样的周期,最大池化是这样:


但如果平移一格,最大池化完全变了一个样子:


虽然,有著名的抗锯齿 (Anti-Aliasing,AA) 方法,致力解决这个问题。但把这种模块直接插进网络,会严重影响模型的表现。

现在,来自Adobe的Richard Zhang (简称“理查”) ,让抗锯齿和各种降采样和平共处了

在保留平移不变性的情况下,还能提升ImageNet上的分类准确率。VGG、ResNet、DenseNet……各种架构都适用。

不止如此, 面对其他干扰更稳定了,如旋转如缩放;面对输入图像的损坏,还更鲁棒了。


研究登上了ICML 2019,代码已经开源,还有演讲可以看。Reddit热度已经超过了250,观众纷纷表达了谢意:

论文很厉害,演讲也很好。

怎样和解的?

想知道怎样帮助CNN保留平移不变形,就要了解平移不变性是怎样打破的。

理查观察了VGG的第一个卷积层,发现它对平移毫无波澜,并不是在这里打破的。

但再观察第一个池化层,对平移有了反应:平移偶数个像素,表征还不改变,平移奇数个像素,表征就完全变了。

向网络深处走,经过的池化层越多,问题就越严重。


△抗锯齿

想解决这个问题,就要把抗锯齿降采样友好地结合到一起。

于是,理查又仔细查看了降采样过程,把它 (按顺序) 分成了两个部分:

一是取最大值,用密集的方式。二是在中间特征图 (Intermediate Feature Map) 上做子采样 (Sub-Sampling) 。

第一步没有问题,完全不会出现锯齿。

第二步就要改了。理查给中间特征图,加了个模糊滤波器 (Blur Filter) 来抗锯齿,然后再做子采样:


△(2)为滤波器

那么,“抗锯齿版最大池化”效果怎么样?

平移不变性与准确率兼得

理查用ImageNet分类任务测试了一下进化后的VGG,原以为会损失一些准确率,结果:


△右为抗锯齿


△空心为抗锯齿

在解锁平移不变性的同时,准确率还提升了。

如果降采样方法不是最大池化,又怎么样呢?

所以,理查还测试了ResNetMobileNetv2,它们用的是跨步卷积;以及DenseNet,它用的是平均池化:


△空心为抗锯齿

这些架构也获得了类似的提升。全面成功。

上面只讲了分类这一项任务。而进化后的降采样,在图到图翻译任务上也同样有效。

不惧各种变换,以及图像损坏

不只是平移,像旋转、缩放这样的干扰,都可以应对自如;另外,面对输入图像损坏 (Image Corruption) ,也变得更加鲁棒了。

ImageNet-P数据集里,有受到各类干扰的图像;而ImageNet-C数据集里,包含了系统性损坏的图像。


△mCE=Mean Corruption Rate, mFR=Mean Flip Rate

左边一栏 (除了Baseline) 之外,是不同的滤波器,从上到下依次变强。mCEmFR,都是越小越好。

数据显示,各种滤波器都能有效增强,应对干扰的稳定性,和应对图像损坏的鲁棒性。其中,最强的过滤器Bin-5表现最佳。

One More Thing

如果小伙伴们没有看够,可以点开演讲视频:

然后,还有一大波传送门。

论文在此:

https://arxiv.org/abs/1904.11486

项目主页:

https://richzhang.github.io/antialiased-cnns/

开源代码:

https://github.com/adobe/antialiased-cnns/

— 完 —

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

  • 人体的血液约占体重的百分之几
  • 2024-11-22人体的血液约占体重的百分之几正常成年人的血液总量约相当于体重的7%~8%平时在饮食方面要保证营养均衡,不要挑食,避免出现营养不良的现象也不要长时间坐着,适当锻炼身体可以促进身体血液循环,提高身体素质,预防疾病的发生。
  • 心领神会是什么意思(心领神会出处及造句)
  • 2024-11-22心领神会出处及造句心领神会释义:心里知道(对方未明说的意思);深刻领会出处:唐·田颖《游雁荡山记》:“将午;始到古寺;老僧清高延坐禅房;与之辩论心性切实之学;彼已心领神会”造句(1)他对她的手势心领神会(2)这道题老师。
  • 兰希黎的美肤老师(兰希黎安娜老师课堂)
  • 2024-11-22兰希黎安娜老师课堂无暇白皙的肌肤,可以说是每一个女人的追求,但是随着外界因素的刺激以及不正确的护肤保养,导致现在很多姐妹们脸上都呈现出了不同的色斑,苦恼的同时还因此非常没自信为了了解正确的祛斑方式,首先,就要了解,斑点。
  • 蒙古国靠什么发展好(蒙古国未来还有可能崛起吗)
  • 2024-11-22蒙古国未来还有可能崛起吗大国崛起是需要条件的:一是要满足国土面积、人口数量足够庞大这样的先天条件;二是要满足政治、经济、军事、科技、文化、社会等方方面面的后天条件像荷兰、瑞士、卡塔尔、科威特、新加坡这些国家无论人均收入多么富。
  • steam戴森球计划价格(默默更新的戴森球计划)
  • 2024-11-22默默更新的戴森球计划在默默更新一周年后,《戴森球计划》已成为2021年Steam全年游戏好评率第二,并且在所有游戏中好评率排名第29,成为史上最受好评的Steam游戏之一《戴森球计划》,其实是开发团队柚子猫工作室账号下的。
  • 侠盗猎车特技车(盘点侠盗猎车5那些种类齐全的自行车)
  • 2024-11-22盘点侠盗猎车5那些种类齐全的自行车亲爱的小伙伴们大家好,相信大部分小伙伴和小编一样,拥有的第一辆载具就是自行车,小伙伴们还记得自己的第一辆自行车吗?自行车作为一种交通工具,既便捷又环保!在《侠盗猎车5》里,也不乏各种自行车的身影……今。
  • 等额本金24年什么时候还款最划算(等额本金还款最划算)
  • 2024-11-22等额本金还款最划算直到现在,还有的朋友认为等额本金的还款方式是最划算的?但其实,不是的我们先来看看比较常见的等额本息和等额本金具体是什么样子的1、等额本息:每个月还款金额固定,其中利息逐月递减,本金逐月递增2、等额本金。
  • 骁龙8gen2和天玑9200购买建议(骁龙8Gen3)
  • 2024-11-22骁龙8Gen3按照惯例,高通每年都会带来旗下芯片产品的迭代升级而随着旗舰芯片产品的更迭,智能手机市场也会开启新一轮的竞争去年11月中旬,2022骁龙峰会正式到来,高通技术公司在这次活动中推出了第二代骁龙8目前,搭载。
  • 厦门学习短营销(厦门举办老字号数字化营销公益培训班)
  • 2024-11-22厦门举办老字号数字化营销公益培训班福建日报·新福建客户端3月2日讯(记者施辰静)近日,在厦门市商务局的指导下,厦门市百年老字号研究院在厦门经济管理学院举办“厦门老字号数字化营销公益培训班”厦门老字号企业及其他传统品牌、相关行业共100。
  • 吃槟榔有啥好处和坏处(吃槟榔的好处和坏处)
  • 2024-11-22吃槟榔的好处和坏处吃槟榔的好处:槟榔有祛痰止咳,消食醒酒的功效,而嚼食槟榔能够让人精神兴奋,还可以让身上发汗,有御寒的功效,槟榔还能消除疲劳坏处有:因为槟榔的汁液呈紫红色,经常嚼槟榔会让人的牙齿变黑,而且槟榔残渣会影响。