yolov3像素级目标识别(基于DIou改进的YOLOv3目标检测)
yolov3像素级目标识别(基于DIou改进的YOLOv3目标检测)
2024-07-01 06:52:51  作者:幸福的插曲  网址:https://m.xinb2b.cn/sport/eem405858.html

yolov3像素级目标识别(基于DIou改进的YOLOv3目标检测)(1)

计算机视觉研究院专栏

作者:Edison_G

背景&引言

文中指出DIoU要比GIou更加符合目标框回归的机制,将目标与anchor之间的距离,重叠率以及尺度都考虑进去,使得目标框回归变得更加稳定,不会像IoU和GIoU一样出现训练过程中发散等问题,并且方法能够简单地迁移到现有的算法中带来性能的提升,实验在YOLOv3上提升了5.91mAP。

yolov3像素级目标识别(基于DIou改进的YOLOv3目标检测)(2)

其中B={x,y,w,h} 是预测框, 是 ground-truth。IoU是目标检测里面很重要的一个指标,通过预测的框和GT间的交集与并集的比例进行计算,经常用于评价bbox的优劣 。但一般对bbox的精调都采用L2范数,而一些研究表明这不是最优化IoU的方法,因此出现了IoU loss。

IoU Loss

yolov3像素级目标识别(基于DIou改进的YOLOv3目标检测)(3)

yolov3像素级目标识别(基于DIou改进的YOLOv3目标检测)(4)

IoU loss顾名思义就是直接通过IoU计算梯度进行回归,论文提到IoU loss的无法避免的缺点:当两个box无交集时,IoU=0,很近的无交集框和很远的无交集框的输出一样,这样就失去了梯度方向,无法优化。IoU loss的实现形式有很多种,除公式2外,还有UnitBox的交叉熵形式和IoUNet的Smooth-L1形式。

这里论文主要讨论的类似YOLO的检测网络,按照GT是否在cell判断当前bbox是否需要回归,所以可能存在无交集的情况。而一般的two stage网络,在bbox regress的时候都会卡, 不会对无交集的框进行回归。

GIoU Loss

yolov3像素级目标识别(基于DIou改进的YOLOv3目标检测)(5)

GIou loss在IoU loss的基础上增加一个惩罚项, 为包围预测框 和 的最小区域大小,当bbox的距离越大时,惩罚项将越大。尽管GIoU解决了IoU的梯度问题,但他仍然存在几个限制:

yolov3像素级目标识别(基于DIou改进的YOLOv3目标检测)(6)

上图可以很好的来说明GIoU不稳定以及收敛很慢的原因。上图中第一行三张图展示的是GIoU的回归过程,其中绿色框为目标框,黑色框为anchor,蓝色框为不同次数的迭代后,anchor的偏移结果。第二行三张图展示的是DIoU的回归过程,其中绿色框为目标框,黑色框为anchor,红色框为不同次数的迭代后,anchor的偏移结果。从图中我们可以看到,GIoU在回归的过程中,从损失函数的形式我们发现,当IoU为0时,GIoU会先尽可能让anchor能够和目标框产生重叠,之后GIoU会渐渐退化成IoU回归策略,因此整个过程会非常缓慢而且存在发散的风险。而DIoU考虑到anchor和目标之间的中心点距离,可以更快更有效更稳定的进行回归。

yolov3像素级目标识别(基于DIou改进的YOLOv3目标检测)(7)

如上图中的包含情况,GIoU会退化成IoU(三个位置预测框和gt框所包围的最小面积相同,惩罚项c保持一致,梯度发散)。由于很大程度依赖IoU项,GIoU需要更多的迭代次数来收敛,特别是水平和垂直的bbox(后面会分析)。一般地,GIoU loss不能很好地收敛SOTA算法,反而造成不好的结果。

综合上面的分析,论文提出Distance-IoU(DIoU) loss,简单地在IoU loss基础上添加一个惩罚项,该惩罚项用于最小化两个bbox的中心点距离。如图1所示,DIoU收敛速度和效果都很好,而且DIoU能够用于NMS的计算中,不仅考虑了重叠区域,还考虑了中心点距离。另外,论文考虑bbox的三要素,重叠区域,中心点距离和长宽比,进一步提出了Complete IoU(CIoU) loss,收敛更快,效果更好。

yolov3像素级目标识别(基于DIou改进的YOLOv3目标检测)(8)

知识回顾

IoU and GIoU Losses

为了全面地分析IoU loss和GIoU的性能,论文进行了模拟实验,模拟不同的距离、尺寸和长宽比的bbox的回归情况,如下图所示:

yolov3像素级目标识别(基于DIou改进的YOLOv3目标检测)(9)

绿色框代表仿真实验需要回归的七个不同尺度的目标框,七个目标框的中心点坐标都是(10 * 10);

蓝色的点代表了所有anchor的中心点,中心点的分布如上图所示,各个方向都有,各种距离都有,当然每个anchor的一个中心点都包含有七个不同面积的anchor框。而且每个面积的anchor框又有七种不同的比例尺寸。因此一共有5000个蓝色点,对应5000*7*7个anchor框,并且每个anchor框都需要回归到七个gt目标框上,因此一共有5000*7*7*7个回归案例。

最终的实验结果如下:图中展示的训练同样的步数后(200步),IoU,GIoU以及本文提出的DIoU、CIoU作为loss的情况下,每个anchor的误差分布。

yolov3像素级目标识别(基于DIou改进的YOLOv3目标检测)(10)

IoU:从IoU误差的曲线我们可以发现,anchor越靠近边缘,误差越大,那些与目标框没有重叠的anchor基本无法回归;

GIoU:从GIoU误差的曲线我们可以发现,对于一些没有重叠的anchor,GIoU的表现要比IoU更好。但是由于GIoU仍然严重的依赖IoU,因此在两个垂直方向,误差很大,基本很难收敛,这就是GIoU不稳定的原因;

DIoU:从DIoU误差的曲线我们可以发现,对于不同距离,方向,面积和比例的anchor,DIoU都能做到较好的回归。

具体伪算法步骤如下:

yolov3像素级目标识别(基于DIou改进的YOLOv3目标检测)(11)

对于预测框 ,当前迭代(current iteration epochs = t)回合, 可以通过下式获得:

yolov3像素级目标识别(基于DIou改进的YOLOv3目标检测)(12)

给定一个loss函数 ,可以通过梯度下降来模拟bbox优化的过程。对于预测的bbox , 为阶段的结果,'为 对 的梯度,使用 来加速收敛。bbox的优化评价使用 -norm,共训练200轮,error曲线如下图所示:

yolov3像素级目标识别(基于DIou改进的YOLOv3目标检测)(13)

论文将5000个中心点上的bbox在最后阶段的total error进行了可视化。IoU loss只对与target box有交集的bbox有效,因为无交集的bbox的梯度为0。而GIoU由于增加了惩罚函数,中间大部分区域错误率明显减少,但是垂直和水平的区域依然保持着高的error,这是由于GIoU的惩罚项经常很小甚至为0,导致训练需要更多的迭代来收敛。

yolov3像素级目标识别(基于DIou改进的YOLOv3目标检测)(14)

计算机视觉研究院学习群等你加入!

计算机视觉研究院主要涉及深度学习领域,主要致力于人脸检测、人脸识别,多目标检测、目标跟踪、图像分割等研究方向。研究院接下来会不断分享最新的论文算法新框架,我们这次改革不同点就是,我们要着重”研究“。之后我们会针对相应领域分享实践过程,让大家真正体会摆脱理论的真实场景,培养爱动手编程爱动脑思考的习惯!

计算机视觉研究院

公众号ID|ComputerVisionGzq

  • 最暖心的早安问候(暖心的早安问候语句子)
  • 2024-07-01暖心的早安问候语句子时间,写在了树干的年轮上,深秋,写在了大雁的翅膀上,一次次问候,穿梭在彼此的短信上,情谊,升华在彼此互动的心坎上天冷注意添衣,照顾好自己!早安!生活,不过就是生下来、活下去生活就像游泳,浮沉进退都是常。
  • 什么样的电脑配置能畅玩gta和吃鸡(第一次买万元游戏本)
  • 2024-07-01第一次买万元游戏本过两天就离职回家了,在外地也没泡到妹子,估摸着带点啥回家,家里就一个台式,不过家里人都喜欢玩,索性准备带一个笔记本回家自己玩,作为一个游戏迷,又不想外接键盘太麻烦,就寻思买一个好一些的游戏本,开始想的。
  • 王玥波谈拜师(王玥波涉足京戏表演)
  • 2024-07-01王玥波涉足京戏表演世界很大,中国也很大,中国人很多,现在听京戏的人已经多起来了王玥波正在排练京戏,据他自己所说,会在自己排练的京戏里面插入一些新的元素,逗观众们一乐看官们看到这里,是不是觉得王玥波说的这个套路特别熟悉呢。
  • 抗氧化的饮料有哪些(植物蛋白饮料经典品牌)
  • 2024-07-01植物蛋白饮料经典品牌(报告出品方/作者:中银证券汤玮亮董广达)植物蛋白饮料经典品牌,积极改变有望带来业绩改善杏仁露市场龙头企业,品牌形象深入人心河北承德露露股份有限公司的前身是承德市罐头食品厂,创立于1950年公司于19。
  • 阜阳人周末都去哪儿玩(阜阳人春节假期去哪玩)
  • 2024-07-01阜阳人春节假期去哪玩我们迎来了农历的新年,春节假期我们在阜阳,除了陪父母、走亲访友之外,不妨利用假期时间带家人出去玩玩,今年春节期间,咱阜阳各大游玩点推出哪些活动?阜小布为大家梳理一下1颍东欢乐城颍东欢乐城1月23日盛大。
  • 阴阳师召唤阵画什么好(阴阳师召唤阵的画法)
  • 2024-07-01阴阳师召唤阵的画法阴阳师现世召唤阵虽然扫一下电脑上的就可以了,但是还是有很多人和琵琶网我一样想要画出来,因为这样就可以随意移动了,你电脑屏幕怎么移动?其实我觉得网易阴阳师这个现世召唤出发点是不错的,只是过于死板,如果有。
  • oppo手机与华为鸿蒙系统(OPPO和小米会使用华为鸿蒙吗)
  • 2024-07-01OPPO和小米会使用华为鸿蒙吗日前,华为发布消息,将在6月2日发布鸿蒙系统,并且将EMUI官网更名为鸿蒙虽然之前鸿蒙已经测试一段时间了,但是这次又发布,又让媒体充满了热度一些媒体在传OPPO会用鸿蒙,小米会用鸿蒙但是随后就有第三方。
  • 为什么中吉乌铁路需要俄罗斯批准(俄罗斯坚决阻止中吉乌铁路)
  • 2024-07-01俄罗斯坚决阻止中吉乌铁路要搞清这个问题,必须先了解一下第一亚欧大陆桥的历史!第一亚欧大陆桥,又称西伯利亚大铁路,它是串联莫斯科和俄罗斯远东地区的一条纵横东西的铁路干线起点是莫斯科,终点是符拉迪沃斯托克(即海参崴)这条铁路线建。
  • 产后膀胱脱垂子宫脱垂怎么恢复(子宫脱垂离我们并不远)
  • 2024-07-01子宫脱垂离我们并不远5月12日是母亲节,辣妈Ella发文迎接自己第三个母亲节,她在文中透露,由于自己在生产过程有点困难,造成子宫和膀胱脱垂,导致产后尿失禁“我打喷嚏、原地跳跃、跑步等动作都会造成尿失禁,不是失禁一点,而是。
  • 女子半年前自行排除肿瘤(福州一女子手术4年后)
  • 2024-07-01福州一女子手术4年后到美容医院做完抽脂手术后,过了四年突然左腹疼痛,一查竟发现是当年手术后体内留下了一根10厘米的引流管!这荒唐的事情最近被福州的陈女士遇上了她告诉《维权超给力》,格莱美美容医院承认异物的存在,但坚称“手。
  • 反问句改陈述句怎么改(反问句改陈述句怎样改)
  • 2024-07-01反问句改陈述句怎样改反问句改陈述句的方法是:首先要将反问句中的肯定词改为否定词,否定词改为肯定词;然后可以将“怎么”、“难道”这种的反问语气词去掉;再将反问句最后的“呢”、“吗”等语气助词去掉;最后将问号改为句号反问句其。