点击上方“AI算法与图像处理”,选择加"星标"或“置顶”git
重磅干货,第一时间送达github
来源:Opencv中文网
web
论文已在后台设置,为了不爆满形成的下载问题,小伙伴能够在后台回复 “ YOLOv4 ”,便可收到论文下载
YOLOv4 没有理论创新,而是在原有YOLO目标检测架构的基础上增长了近年CNN改进的众多技术,从数据处理到网络训练再到损失函数,遵行“拿来主义”,加上漂亮的工程实践,打造实现最佳速度与精度平衡的目标检测新基准!算法
在MS COCO 数据集 实现 43.5% AP (65.7% AP50 ), 速度也更快了,在Tesla V100 GPU上 ∼65 FPS!微信
上图为YOLOv4与其余SOTA目标检测算法的比较,在精度差很少的状况下YOLOv4比EfficientDet快两倍,而相对于YOLOv3 AP和FPS 分别提高了10%和12%!网络
做者首先对现有目标检测方法进行了总结,不管是one-stage 、two-stage 仍是 anchor free 、anchor based,均包含 Input、Backbone 、Neck、Heads(Dense Prediction或者Sparse Prediction)四部分。架构
目前各部分的主流技术包括:app
而后做者对现有目标检测相关技术的进展作了总结,即大礼包“bag of freebies”和特价袋“Bag of specials”。编辑器
bag of freebies 指那些可以提升精度而不增长推断时间的技术。好比数据增广的方法图像几何变换、CutOut、grid mask等,网络正则化的方法DropOut、DropBlock等,类别不平衡的处理方法、难例挖掘方法、损失函数的设计等。函数
-
bag of specials 是指那些增长稍许推断代价,但能够提升模型精度的方法,好比增大模型感觉野的SPP、ASPP、RFB等,引入注意力机制Squeeze-and-Excitation (SE) 、Spatial Attention Module (SAM)等 ,特征集成方法SFAM , ASFF , BiFPN等,改进的激活函数Swish、Mish等,或者是后处理方法如soft NMS、DIoU NMS等
架构选择:
通过综合考虑计算量和精度,做者最终选择的架构是:CSPDarknet53 做为 backbone, SPP 模块用于增大感觉野, PANet 用做 neck, 并仍沿袭 YOLOv3(anchor based) head。
做者在MS COCO 数据集上进行了实验,结果以下:
每一行分别表明不一样的GPU计算结果:
在主流的SOTA目标检测算法中,YOLOv4实现了最佳的速度和精度的平衡,
在精度差很少的状况下,YOLOv4的速度每每是最快的,
尤为在FPS超过30的实时算法中,YOLOv4是精度最高的。
由于不一样的算法公布时可能在不一样的GPU上进行测试,做者根据不一样的GPU(Maxwell/Pascal/Volta)分别列出了YOLOv4与其余算法的更详细的比较,即Table 八、九、10,帧率大于等于30的用蓝底标出。
可见YOLOv4 在实时目标检测算法中精度最高,实现了精度和速度的最佳平衡。
论文地址:
虽然YOLOv4在理论上没有创新,但其引人注目的精度速度,承袭YOLO系列的简单易上手的操做体验,必将成为实时目标检测的口碑之做!
end


本文分享自微信公众号 - AI算法与图像处理(AI_study)。
若有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一块儿分享。