转载自:https://blog.csdn.net/gaohuazhao/article/details/60871886python
另外,可参考:https://blog.csdn.net/dcxhun3/article/details/52923310git
相信看这篇文章的人都在作深度学习吧,此数据集是为目标检测作的数据集,有错误处请海涵github
代码见个人github上:https://github.com/EddyGao/make_VOC2007
第一步:首先了解VOC2007数据集的格式dom
1)JPEGImages文件夹学习
文件夹里包含了训练图片和测试图片,混放在一块儿测试
2)Annatations文件夹spa
文件夹存放的是xml格式的标签文件,每一个xml文件都对应于JPEGImages文件夹的一张图片.net
3)ImageSets文件夹xml
Action存放的是人的动做,咱们暂时不用blog
Layout存放的人体部位的数据。咱们暂时不用
Main存放的是图像物体识别的数据,分为20类,固然咱们本身制做就呵呵呵不必定了,若是你有精力,Main里面有test.txt , train.txt, val.txt ,trainval.txt.这四个文件咱们后面会生成
Segmentation存放的是可用于分割的数据
4)其余的文件夹不解释了,分割XXX等用的
若是你下载了VOC2007数据集,那么把它解压,把各个文件夹里面的东西删除,保留文件夹名字。若是没下载,那么就仿照他的文件夹格式,本身建好空文件夹就行。
第二步:搞定JPEGSImages文件夹
1)把你的图片放到JPEGSImages里面,在VOC2007里面,人家的图片文件名都是000001.jpg相似这样的,咱们也统一格式,把咱们的图片名字重命名成这样的,若是你的文件太多怎么办,请看个人另外一篇文章http://blog.csdn.net/gaohuazhao/article/details/60324715 能批量重命名文件
第三步:搞定Annatations文件夹
网上不少教程,可是我以为都很麻烦,直到我遇到了一位大神作的软件,手动标注,会自动生成图片信息的xml文件
1)在这里下载:https://github.com/tzutalin/labelImg,至于怎么用相信你打开就知道了。(https://github.com/puzzledqs/BBox-Label-Tool)
2)保存的路径就是咱们的Annatations文件夹,别保存别的地方去了,,,
3)一张张的慢慢画框。。。。。。。。。大约过了几个小时,好继续下一步
第四步:搞定ImageSets文件夹中的Main文件夹中的四个文件
直接上一个代码给你:
OK,制做完成,就是这么简单,那么解释一下这四个txt文档是干吗的,看名字就知道,就是分分多少图片做为训练,多少图片做为测试,,,,