IoU及其变种,以及目前最佳Shape-IoU

发布时间 2024-01-03 11:22:28作者: jimchen1218

1)IoU:

优点:能够准确地描述了预测框和GT框之间的匹配程度

缺点:当两个框的交点为0时,无法准确描述预测框和GT框之间的位置关系

2)GIoU:

优点:引入最小检测框来解决,其中C表示GT框和 Anchor 框之间的最小检测框。

3)DIoU:

b和bgt分别表示 Anchor 框的中心点和GT框的中心点,p表示欧几里得距离,其中c表示b和bgt之间的最小检测框的斜边长度。

优点:考虑了边界框之间的距离约束,并在IoU的基础上添加了中心点归一化距离损失项,从而使得回归结果更准确。

CIoU:

考虑预测框和GT框的中心点间的归一化距离最小化,增加了一个形状损失项来减少Anchor框和GT框之间的宽高比差异,以更准确地通过角的变化 来判断预测框和GT框的匹配程度

4)EIoU

根据CIoU重新定义了形状损失,并进一步通过直接减小GT框和 Anchor 框之间的宽高比来提高检测精度

 wc和hc分别表示最小检测框覆盖GT框和 Anchor 框的宽度和高度

5) SIoU

进一步考虑了边界框之间的角度对边界框回归的影响,旨在通过减小 Anchor 框和GT框之间的角度(水平或垂直方向)来加速收敛过程。

 6)针对小目标 点距离Dot Distance和Normalized Wasserstein Distance(NWD)被提出以克服对IoU值的敏感性;

a.Dot Distance

 D表示GT框中心点与 Anchor 框中心点之间的欧几里得距离,S表示数据集中目标的平均大小,M表示图像的数量,Ni表示第i张图像中的标注边界框数量,wij和hij分别表示第i张图像中第j个边界框的宽度和高度。

b.Normalized Wasserstein Distance(NWD)

 权重w=2,C与数据集相关的常数;

Shape-IoU

 

 scale是缩放因子,与数据集中目标的大小相关,ww和hh分别表示水平方向和垂直方向上的权重系数,其值与GT框的形状有关。

针对小目标的Shape-Dot

将Shape-IoU思想融入点距离,得到Shape-Dot Distance

 同样,将Shape-IoU融入归一化NWD中,得到Shape-NWD