做者:Deeksha Arya等git
编译:CV君github
报道:我爱计算机视觉公众号(id:aicvml)算法
向你们推荐一篇论文『Global Road Damage Detection: State-of-the-art Solutions』,它总结了在 IEEE International Conference on Big Data'2020 会议中举办的 “Global Road Damage Detection Challenge (GRDDC) ,全球道路损坏检测挑战赛”中前 12 名的解决方案。微信
其不只给出了各参赛队的方案,并且这些代码也所有开源了,相信对于学术和工业界的朋友都会颇有帮助。
app
本次挑战赛的任务是对几种道路损伤进行检测,不只要分类出损伤类别,还要定位到损伤的位置,故该比赛实质是一个目标检测问题。编辑器
01 学习
GRDDC'2020 数据集是从印度、日本和捷克收集的道路图像。包括三个部分:Train, Test1, Test2。训练集包括带有 PASCAL VOC 格式 XML 文件标注的道路图像。在给参赛者的数据Test1 和 Test2 中是没有标注。train则包含标注。测试
数据分布以下:flex

三个数据集和三个国家的图像分布统计网站

02
评估方法
GRDD 挑战赛的评估标准是F1-Score。
对于参赛者提交的预测结果,若是预测知足如下两个标准,则认为它是正确的。
predicted bounding box 与 ground truth bounding box 之间的重叠区域超过 50%,即 IoU > 0.5。
预测的标签与实际的标签相匹配,如图像的标注文件中所指定的(ground truth)。
评估脚本比较两个输入文件以及计算所提交的 F1-Score。F1-Score 为精确率和召回率的调和平均数,精确度是真阳性与全部预测阳性的比率。召回率是真正的阳性结果与全部实际阳性结果的比率。
各参数的细节以下:
真阳性(TP):ground truth 中存在一个损害实例,而且该实例的标签和边界框被正确预测,IoU>0.5。
假阳性(FP):当模型预测了图像中某一特定位置的损害实例,但该实例并不存在于图像的 ground truth 中。也包括了预测标签与实际标签不匹配的状况。
假阴性(FN):当一个损害实例出如今 ground truth 中,但模型没法预测正确的标签或该实例的边界框。
召回率:
精确度:
F1-Score:
F1指标对召回和精度的权重相等。所以,参赛者须要在二者都有中等水平的表现,而不是在其中一个方面表现突出,在另外一个方面表现不佳。对 test1 和test2 分别计算 F1。最后,用两个分数的平均值对各队进行排名。
03
结果和排名
获胜团队的最后得分及代码以下:
Test1-Score:0.6748
Test2-Score:0.6662
(这个结果是远超第二名的!)
做者已经公开了代码:
https://github.com/USC-InfoLab/rddc2020
第二名
第三名
方案:以Cascade R-CNN为基础模型的模型集合。数据增广用到:道路分割、混合、CLAHE、 RGB shift。该团队也探索使用过的其余算法:Faster-RCNN, ResNeXt101, HR-Net, CBNet, ResNet-50。
第四名
方案:CSPDarknet53主干网上训练的YOLO模型。无数据增广。其还探索使用过 Hourglass104和 EfficientNet 主干网上训练的 CenterNet 和 EfficientDet 模型。
第五名
方案:主方法是:YOLOv5x。对于数据增广:图像HSV、图像转换、图像比例、水平翻转、马赛克。
第六名
方案:Ensemble(YOLO-v4 + Faster-RCNN)。
第七名
方案:EfficientDet 。



第八名
方案:主方法 YOLOv4,以及其它数据增广方法:经过调整亮度、对比度、色调、饱和度和噪声进行图像转换。随机缩放和 Mosaic 数据加强,条件GAN。
第九名
方案:Faster RCNN+ Resnet-18/Resnet-50。使用过数据增广但没有改善精度。
第十名
方案:使用Resnet-50和Resnet-101主干网的多级 Faster R-CNN,以及以CSPNet 为主干网的 Yolov5。数据增广:对路面进行尺寸调整和语义分割(这样只检测路面部分)。
第十一名
方案:Detectron2 和 Faster R-CNN。数据增广使用了水平镜像和缩放。
第十二名
方案:FR-CNN。
前 12 支团队所取得的排名及得分状况


05
结果讨论
YOLOv五、YOLOv4是比赛中经常使用的模型,u版YOLOv5很优秀;
几乎全部团队都使用了数据增广,其能够显著改善精度,但也有用了没效果的时候;
目标检测中的集成学习:
多图像输入+多模型测试+结果送入NMS。

备注:目标检测

目标检测交流群
2D、3D目标检测等最新资讯,若已为CV君其余帐号好友请直接私信。
微信号:aicvml
QQ群:805388940
微博知乎:@我爱计算机视觉
投稿:amos@52cv.net
网站:www.52cv.net

在看,让更多人看到
本文分享自微信公众号 - 我爱计算机视觉(aicvml)。
若有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一块儿分享。