论文笔记-SNIPER：Efficient Multi-Scale Training

时间 2021-01-12

原文原文链接

1. 介绍目前的目标检测架构都是对输入图像的所有像素进行操作，从而产生proposals等，当采用多尺寸的图像金字塔时，所需的存储空间很大，在训练时，单一GPU上能训练的图像数量很小（取决于GPU的显存和图像的分辨率），这样就造成了batch size很小，从而使训练时间很长。因此作者提出了一种新的训练思路：先粗略定位一下正负例所在的区域，然后以该区域内的像素信息作为卷积网络的输入，再精确检

>>阅读原文<<