论文:Cascade R-CNN: Delving into High Quality Object Detection
来源:CVPR 2018
在anchor-based检测器中,一般是根据候选框(anchor或proposal)和GT框的IoU阈值 u u u来界定正负样本。通常取IoU阈值 u = 0.5 u=0.5 u=0.5,这时正样本数量较多,有利于缓解正负样本平衡问题,但是,较低的IoU阈值会降低正样本的总体质量,最终导致检测器产生较多的false positive,如下所示。
解决上述问题最直接的方法就是提高IoU阈值。随着IoU阈值的增大,正样本与GT框匹配程度会更高,正样本所包含的背景信息也会越小,这样应该可以减小false positive的数量,回归器也将更容易实现高精度定位。
但真的是这样吗?实际上,随着IoU阈值的增大,正样本的数量会指数性减少,最终检测器会因正样本数量不足而产生过拟合问题。下图所示为RPN的输出proposal在各个IoU范围内的数量。可以看到,正样本的数量确实随IoU阈值的增大而指数性衰减。IoU在0.7以上的proposals数量很少,而 u = 0.7 u=0.7 u=0.7时的 A P AP AP比 u = 0.5 u=0.5 u=0.5时的 A P AP AP更低。