论文笔记-SNIPER:Efficient Multi-Scale Training

  1. 介绍 目前的目标检测架构都是对输入图像的所有像素进行操作,从而产生proposals等,当采用多尺寸的图像金字塔时,所需的存储空间很大,在训练时,单一GPU上能训练的图像数量很小(取决于GPU的显存和图像的分辨率),这样就造成了batch size很小,从而使训练时间很长。因此作者提出了一种新的训练思路:先粗略定位一下正负例所在的区域,然后以该区域内的像素信息作为卷积网络的输入,再精确检
相关文章
相关标签/搜索