题目:ObjectDetectionin20Years:ASurvey
作者:ZhengxiaZou(1),ZhenweiShi(2),YuhongGuo(3and4),JiepingYe(1and4)
((1)UniversityofMichigan,(2)BeihangUniversity,(3)CarletonUniversity,(4)DiDiChuxing)
参考链接:
引言
近几年,视觉目标检测的研究工作非常多,发表了许多关于一般目标检测的综述[24-28]。本文与上述综述的主要区别如下:
本文的其余部分组织如下。在第二部分中,我们回顾了20年来目标检测的发展历史。第3节将介绍一些加速目标检测的技术。第四部分总结了近三年来一些最先进的检测方法。第5节将回顾一些重要的检测应用。第六部分对本文进行了总结,并对进一步的研究方向进行了分析。
图1从1998年到2018年,越来越多的关于目标检测的论文发表。(数据来自谷歌scholaradvancedsearch:allintitle:“objectdetection”AND“detectionobjects”)
图2目标检测的路线图。图中的里程碑检测器:VJDet.[10,11],HOGDet.[12],DPM[13-15],RCNN[16],SPPNet[17],FastRCNN[18],FasterRCNN[19],YOLO[20],SSD[21],PyramidNetworks[22],Retina-Net[23]。
图3。在VOC07、VOC12和MS-COCO数据集上对目标检测精度的提高。图中检测器:DPM-v1[13],DPM-v5[21]0,RCNN[16],SPPNet[17],FastRCNN[18],FasterRCNN[19],SSD[21],FPN[22],Retina-Net[23],RefineDet[55],TridentNet[56]。
图4(a)PASCAL-VOC07、(b)ILSVRC、(c)MS-COCO和(d)Openimages中的一些示例图像和标注。
表1一些常用的目标检测数据集及其统计数据。
图5早期一些著名的检测模型:(a)Eigenfaces[95],(b)Sharedweightnetworks[96],(c)Spacedisplacementnetworks(Lenet-5)[97],(d)HaarwaveletsofVJdetector[10]。
图6从2001年到2019年,多尺度检测技术在目标检测中的发展:1)特征金字塔和滑动窗口,2)基于objectproposals的检测,3)深度回归,4)多参考检测,5)多分辨率检测。图中检测器:VJDet.[10],HOGDet.[12],DPM[13,15],ExemplarSVM[36],Overfeat[103],RCNN[16],SPPNet[17],FastRCNN[18],FasterRCNN[19],DNNDet.[104],YOLO[20],YOLO-v2[48],SSD[21],UnifiedDet.[105],FPN[22],RetinaNet[23],RefineDet[55],TridentNet[56].
图72001-2019年boundingboxregression技术在目标检测中的发展。图中检测器:VJDet.[10],HOGDet.[12],ExemplarSVM[36],DPM[13,15],Overfeat[103],RCNN[16],SPPNet[17],FastRCNN[18],FasterRCNN[19],YOLO[20],SSD[21],YOLO-v2[48],UnifiedDet.[105],FPN[22],RetinaNet[23],RefineDet[55],TridentNet[56].
图82001-2019年contextpriming在目标检测中的演变:1)局部上下文检测,2)全局上下文检测,3)上下文交互检测。图中检测器:FaceDet.[139],MultiPath[140],GBDNet[141,142],CC-Net[143],MultiRegion-CNN[144],CoupleNet[145],DPM[14,15],StructDet[146],YOLO[20],RFCN++[147],ION[148],AttenContext[149],CtxSVM[150],PersonContext[151],SMN[152],RetinaNet[23],SIN[153].
图9从1994年到2019年,non-maxsuppression(NMS)技术在目标检测中的发展:1)Greedyselection,2)Boundingboxaggregation,3)LearntoNMS。该图中的检测器有:VJDet.[10],FaceDet.[96],HOGDet.[12],DPM[13,15],RCNN[16],SPPNet[17],FastRCNN[18],FasterRCNN[19],YOLO[20],SSD[21],FPN[22],RetinaNet[23],LearnNMS[154],MAP-Det[155],End2End-DPM[136],StrucDet[146],Overfeat[103],APC-NMS[156],MAPC[157],SoftNMS[158],FitnessNMS[159].
图10从1994年到2019年,目标检测中hardnegativemining技术的发展。图中检测器有:FaceDet.[164],HaarDet.[29],VJDet.[10],HOGDet.[12],DPM[13,15],RCNN[16],SPPNet[17],FastRCNN[18],FasterRCNN[19],YOLO[20],SSD[21],FasterPed[165],OHEM[166],RetinaNet[23],RefineDet[55].
图12目标检测中加速技术的概述。
图13说明如何计算图像的HOG映射。
图16利用快速傅立叶变换和反快速傅立叶变换在频域中加速线性检测器(如HOG检测器、DPM等)[226]。
图17三种检测器的检测精度的比较:FasterRCNN[19],R-FCN[46]和SSD[21]在具有不同检测引擎的MS-COCO数据集上。图片来自J.Huangetal.CVPR2017[27]。
图18不同的特征融合方法的说明:(a)bottomupfusion,(b)top-downfusion,(c)element-wisesum,(d)element-wiseproduct,和(e)concatenation.
图21人脸检测面临的挑战:(a)类内变异,图片来自于WildestFacesDataset[70]。(b)面部遮挡,来自UFDD数据集的图像[69]。(c)多尺度人脸检测。图片来自P.Huetal.CVPR2017[322].
结论与未来发展方向
作者也对目标检测未来的趋势做了简要的描述,未来的目标检测研究可能会集中在以下几个方面:
-END-
专·知
点击“阅读原文”,了解报名专知《深度学习:算法到实战》课程