YOLO9000学习总结

1:首先将图像划分成7 * 7的网格。 2:每个网格要预测B个bounding box,每个bounding box除了要回归自身的位置之外,还要附带预测一个 confidence值。  3:每个网格有30维,这30维中,8维是回归box的坐标,2维是box的confidence,还有20维是类别。 confidence代表了所预测的bounding box中含有object的置信度和这个boun
相关文章
相关标签/搜索