刚刚！YOLOv4重磅推出！代码已开源！

点击上方“AI算法与图像处理”，选择加"星标"或“置顶”git

重磅干货，第一时间送达github

来源：Opencv中文网
web

论文已在后台设置，为了不爆满形成的下载问题，小伙伴能够在后台回复 “ YOLOv4 ”，便可收到论文下载

今年初 YOLO 之父Joseph Redmon宣布推出CV界，引发轩然大波，你们纷纷猜想YOLO是否不会再出v4版，退出历史舞台。

今天，YOLOv4重磅发布，做者为俄罗斯开发者 Alexey Bochkovskiy 和两位台湾开发者 Chien-Yao Wang、Hong-Yuan Mark Liao。

YOLOv4 没有理论创新，而是在原有YOLO目标检测架构的基础上增长了近年CNN改进的众多技术，从数据处理到网络训练再到损失函数，遵行“拿来主义”，加上漂亮的工程实践，打造实现最佳速度与精度平衡的目标检测新基准！算法

在MS COCO 数据集实现 43.5% AP (65.7% AP50 )，速度也更快了，在Tesla V100 GPU上 ∼65 FPS！微信

上图为YOLOv4与其余SOTA目标检测算法的比较，在精度差很少的状况下YOLOv4比EfficientDet快两倍，而相对于YOLOv3 AP和FPS 分别提高了10%和12%！网络

目标检测模型架构

做者首先对现有目标检测方法进行了总结，不管是one-stage 、two-stage 仍是 anchor free 、anchor based，均包含 Input、Backbone 、Neck、Heads（Dense Prediction或者Sparse Prediction）四部分。架构

目前各部分的主流技术包括：app

而后做者对现有目标检测相关技术的进展作了总结，即大礼包“bag of freebies”和特价袋“Bag of specials”。编辑器

bag of freebies 指那些可以提升精度而不增长推断时间的技术。好比数据增广的方法图像几何变换、CutOut、grid mask等，网络正则化的方法DropOut、DropBlock等，类别不平衡的处理方法、难例挖掘方法、损失函数的设计等。函数

bag of specials 是指那些增长稍许推断代价，但能够提升模型精度的方法，好比增大模型感觉野的SPP、ASPP、RFB等，引入注意力机制Squeeze-and-Excitation (SE) 、Spatial Attention Module (SAM)等，特征集成方法SFAM , ASFF , BiFPN等，改进的激活函数Swish、Mish等，或者是后处理方法如soft NMS、DIoU NMS等

0 2

YOLOv4方法介绍

架构选择：

通过综合考虑计算量和精度，做者最终选择的架构是：CSPDarknet53 做为 backbone, SPP 模块用于增大感觉野, PANet 用做 neck, 并仍沿袭 YOLOv3(anchor based) head。

最终 YOLOv4实用的技术：

实验结果

做者在MS COCO 数据集上进行了实验，结果以下：

每一行分别表明不一样的GPU计算结果：

由于不一样的算法公布时可能在不一样的GPU上进行测试，做者根据不一样的GPU（Maxwell/Pascal/Volta）分别列出了YOLOv4与其余算法的更详细的比较，即Table 八、九、10，帧率大于等于30的用蓝底标出。

可见YOLOv4 在实时目标检测算法中精度最高，实现了精度和速度的最佳平衡。

传送门

论文地址：

https://arxiv.org/pdf/2004.10934v1.pdf

开源地址：

https://github.com/AlexeyAB/darknet

不只有代码、模型并且提供了详细的训练和测试方法。

（公众号后台回复“ YOLOv4 ”，便可收到论文下载）

虽然YOLOv4在理论上没有创新，但其引人注目的精度速度，承袭YOLO系列的简单易上手的操做体验，必将成为实时目标检测的口碑之做！

end

我的微信

请注明： 地区+学校/企业+研究方向+昵称

若是没有备注不拉群！

分享是一种美德！ 👇

本文分享自微信公众号 - AI算法与图像处理（AI_study）。
若有侵权，请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”，欢迎正在阅读的你也加入，一块儿分享。