yolov3

思想:yolo主模型输出三个特征图,如(?,13,13,anchor_num*(5+num_classes))、(?,26,26,anchor_num*(5+num_classes))、(?,52,52,anchor_num*(5+num_classes)),以后如尺度为13的特征图 会   变形为(?,13,13,anchor_num,5+num_classes),最后一维前五个分别为4个框值xywh和1个框中含有物体的置信度。.net

后面为各种别几率。 ?为batch,13*13 为检测的尺度,最后会还原成:框坐标(?*13*13*3,4),至关于每张图检测了13*13*3个框(固然有不少无效的和重复的,以后会筛选),3是对应于一层3个anchor中心值,此值是原框d w聚类来的。blog

一张图至关于输出3层特征图,第一层至关于检测了13*13*3个框,第二三层至关于检测了26*26*3和52*52*3个框,因此说大尺寸检测的小物体,小尺寸检测的大物体,而后把三层检测的框纵向拼接到一块儿,在进行筛选。io

 

每里面的最大框数 是指某一类别的框不超过最大框数,全部类别加一块儿有可能超过最大框数class

anchor:至关于每张图会生成13*13*3(26和52) 个框,每一个框都去和9个anchor作交叉比iou,选出交叉比比大于阈值的,这样虽然选的很糙,但以后会有边界框修正操做。就是至关于先找了几个固定位置,让选的框不要偏离这几个位置太多。以后在对选出的框做偏移修正。test

论文解读gc

https://blog.csdn.net/yangchengtest/article/details/80664415sse

相关文章
相关标签/搜索