栗子 发自 凹非寺
量子位 报道 | 公众号 QbitAI
古往今来,大家都知道:只要图像一平移,CNN就认不出来了。
原因就在降采样身上。不管是最大池化,跨步卷积,还是平均池化,都对平移太敏感:
比如,0、0、1、1、0、0、1、1……这样的周期,最大池化是这样:
但如果平移一格,最大池化完全变了一个样子:
虽然,有著名的抗锯齿 (Anti-Aliasing,AA) 方法,致力解决这个问题。但把这种模块直接插进网络,会严重影响模型的表现。
现在,来自Adobe的Richard Zhang (简称“理查”) ,让抗锯齿和各种降采样和平共处了。
在保留平移不变性的情况下,还能提升ImageNet上的分类准确率。VGG、ResNet、DenseNet……各种架构都适用。
不止如此, 面对其他干扰更稳定了,如旋转如缩放;面对输入图像的损坏,还更鲁棒了。
研究登上了ICML 2019,代码已经开源,还有演讲可以看。Reddit热度已经超过了250,观众纷纷表达了谢意:
论文很厉害,演讲也很好。
怎样和解的?想知道怎样帮助CNN保留平移不变形,就要了解平移不变性是怎样打破的。
理查观察了VGG的第一个卷积层,发现它对平移毫无波澜,并不是在这里打破的。
但再观察第一个池化层,对平移有了反应:平移偶数个像素,表征还不改变,平移奇数个像素,表征就完全变了。
向网络深处走,经过的池化层越多,问题就越严重。
△抗锯齿
想解决这个问题,就要把抗锯齿和降采样友好地结合到一起。
于是,理查又仔细查看了降采样过程,把它 (按顺序) 分成了两个部分:
一是取最大值,用密集的方式。二是在中间特征图 (Intermediate Feature Map) 上做子采样 (Sub-Sampling) 。第一步没有问题,完全不会出现锯齿。
第二步就要改了。理查给中间特征图,加了个模糊滤波器 (Blur Filter) 来抗锯齿,然后再做子采样:
△(2)为滤波器
那么,“抗锯齿版最大池化”效果怎么样?
平移不变性与准确率兼得
理查用ImageNet分类任务测试了一下进化后的VGG,原以为会损失一些准确率,结果:
△右为抗锯齿
△空心为抗锯齿
在解锁平移不变性的同时,准确率还提升了。
如果降采样方法不是最大池化,又怎么样呢?
所以,理查还测试了ResNet和MobileNetv2,它们用的是跨步卷积;以及DenseNet,它用的是平均池化:
△空心为抗锯齿
这些架构也获得了类似的提升。全面成功。
上面只讲了分类这一项任务。而进化后的降采样,在图到图翻译任务上也同样有效。
不惧各种变换,以及图像损坏
不只是平移,像旋转、缩放这样的干扰,都可以应对自如;另外,面对输入图像损坏 (Image Corruption) ,也变得更加鲁棒了。
ImageNet-P数据集里,有受到各类干扰的图像;而ImageNet-C数据集里,包含了系统性损坏的图像。
△mCE=Mean Corruption Rate, mFR=Mean Flip Rate
左边一栏 (除了Baseline) 之外,是不同的滤波器,从上到下依次变强。mCE和mFR,都是越小越好。
数据显示,各种滤波器都能有效增强,应对干扰的稳定性,和应对图像损坏的鲁棒性。其中,最强的过滤器Bin-5表现最佳。
One More Thing如果小伙伴们没有看够,可以点开演讲视频:
然后,还有一大波传送门。
论文在此:
https://arxiv.org/abs/1904.11486
项目主页:
https://richzhang.github.io/antialiased-cnns/
开源代码:
https://github.com/adobe/antialiased-cnns/
— 完 —
诚挚招聘
量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。
量子位 QbitAI · 头条号签约作者
վ'ᴗ' ի 追踪AI技术和产品新动态
cnn做图像分类详解(给CNN平移不变性同时提升ImageNet成绩)
2024-11-25 06:26:20 作者:哗众取宠 网址:https://m.xinb2b.cn/sport/ftb223314.html
- 柚子的饮食禁忌是什么(爱吃柚子的亲们注意了)
- 2024-11-25爱吃柚子的亲们注意了1.红柚和白柚最大的区别就是所含的色素不同柚子的红肉颜色主要来源是番茄红素柚子的维生素C含量跟柚子的颜色并没有太直接的关系,主要还是与品种差异有关2.柚子皮并没有治疗乙肝和抗癌的奇效柚子皮中含有的香精。
- 忍者神龟改版可选boss(忍者神龟全新原创3A游戏将于2023年推出)
- 2024-11-25忍者神龟全新原创3A游戏将于2023年推出近期忍者神龟IP在游戏领域似乎正卷土重来,今年一款由TributeGames开发,Dotemu负责发行,名为《忍者神龟:施莱德的复仇(TeenageMutantNinjaTurtles:Shredde。
- 黑暗之魂3全boss排名(黑暗之魂3里的角色名字背后藏着什么故事)
- 2024-11-25黑暗之魂3里的角色名字背后藏着什么故事导语:《黑暗灵魂》作为FromSoftware的黑暗幻想系列作品,一贯以晦涩难懂的故事剧情为特色而游戏作为一种文艺作品,自然也会运用大量文学和影视作品的手法来把玩观众,把玩故事本身而作为游戏,其中一个。
- 学习好的孩子和老妈斗嘴都不一样(学霸妈陪儿子读)
- 2024-11-25学霸妈陪儿子读随着近几年古典文化的大热,越来越多家长意识到:多学古诗词不但能让孩子们的审美水平提高,对他们的表达能力、理解能力都有极大的帮助于是很多小朋友在家的课外时间,就被要求读一些诗词这本来是件好事,但令人无奈。
- 世界上最高等级的生命体(占地近9平方公里)
- 2024-11-25占地近9平方公里人类作为自然界当中智商最高的生物,拥有了异常发达的大脑,而为了使得大脑快速发育,我们的祖先在进化的过程当中可谓是舍弃了不少的东西比如从我们的体型来看,就比自然界当中的许多生物小得多人和大象的体型对比那。
- 螃蟹冬瓜汤的做法(家常螃蟹冬瓜汤的做法)
- 2024-11-25家常螃蟹冬瓜汤的做法原料:螃蟹、冬瓜、料酒、盐食材:螃蟹(已清洗)、冬瓜(已去皮去籽清洗切开)将已清洗好的螃蟹去蟹壳蟹鳃用剪刀剪开烧锅倒油烧热,下入已剪开的螃蟹,加适量的料酒翻炒一下接着,合入冬瓜,加适量的清水翻动一下、。
- 夜场怎么敬酒说话(夜场敬酒的说辞)
- 2024-11-25夜场敬酒的说辞酒的礼节就是先称呼对方,说敬对方一杯酒,如果距离在两个手臂距离以外,你应该先站起双手举杯,以示尊敬敬酒辞围绕对方展开,一般是酒席开展目的还有就是围绕他的特点等他爱听的话如果不大会说,很简单,生意人祝他。
- 江财职业学院是几本(江西省院校层次分析)
- 2024-11-25江西省院校层次分析前几天,我按照本省考生了解本省大学的逻辑,按本省考生报考本省大学的录取分数,对广东、江苏、河南、湖北四省的大学进行了层次分析今天这篇文章,我们集中分析一下江西省院校的层次!我们以理科本科数据为例来进行。
- 奋斗才是王道正能量(为奋斗的人们提供不竭的精神力量)
- 2024-11-25为奋斗的人们提供不竭的精神力量中新网客户端北京6月28日电(记者袁秀月)“到那时,中国的面貌将会被我们改造一新到那时,到处都是活跃的创造,到处都是日新月异的进步……这时,我们民族就可以无愧色地立在人类的面前……”86年前,身陷囹圄。
- 男人五指短粗(男人要五大三粗)
- 2024-11-25男人要五大三粗男人要“五大三粗”,指哪“五大”?哪“三粗”?老祖宗分析在理中国古代流传下来众多民间俗语老话,它们大多言简意赅、通俗易懂,是古代劳动人民智慧的结晶,反映了当时人们追求美好生活的诸多经验和愿望,如:“宁。
- 全球新动物(动物比你想象中聪明得多)
- 2024-11-25动物比你想象中聪明得多新华社北京2月28日新媒体专电美国《新闻周刊》网站2月23日刊登记者塞伦·莫里斯的报道,题为《比人们想象中聪明得多的动物》全文摘编如下:睿智的老猫头鹰,灵巧的章鱼……一些动物以聪明而著称那么像羊和猪这。
- 如何接入一个推荐系统(推荐系统从入门到接着入门)
- 2024-11-25推荐系统从入门到接着入门前言想来惭愧,推荐系统从大四做毕设时就开始接触了,不过当时对于推荐系统也是云里雾里,没有一个整体的概念,更别说总结写博客了正好研究生也是这个方向,最近一年看了一些综述论文、经典书籍以及好的博客,希望通。