为了获取大量的图片训练数据,在采集数据的过程当中经常使用视频的方式采集数据,但对于深度学习,训练的过程须要不少的有有标签的数据,这篇文章主要是解决视频文件转换成图片文件,并加标签,最后把数据存储到pkl文件中,为后续深度学习提供数据。python
# 导入所须要的库 import cv2 import numpy as np
# 定义保存图片函数 # image:要保存的图片名字 # addr;图片地址与相片名字的前部分 # num: 相片,名字的后缀。int 类型 def save_image(image,addr,num): address = addr + str(num)+ '.jpg' cv2.imwrite(address,image)
# 读取视频文件 videoCapture = cv2.VideoCapture("./input/chen6.30.mp4") # 经过摄像头的方式 # videoCapture=cv2.VideoCapture(1)
#读帧 success, frame = videoCapture.read() i = 0 while success : i = i + 1 save_image(frame,'./output/img_',i) if success: print('save image:',i) success, frame = videoCapture.read()
save image: 1 save image: 2 save image: 3 save image: 4 save image: 5 save image: 6......
import numpy as np from PIL import Image import pickle import matplotlib.pyplot as plt %matplotlib inline
img_640 = Image.open('./output/img_640.jpg') img_910 = Image.open('./output/img_910.jpg')
# 显示图片 plt.imshow(img_640)
<matplotlib.image.AxesImage at 0x15ece1330b8>
img_640_n = np.array(img_640) img_910_n = np.array(img_910)
type(img_640_n)
numpy.ndarray
# 建立一个空list,用于存储图像数据由于是两张图片说以建立2个(480, 640, 3)的矩阵。 image_data = []
# 把数据存放进来 image_data.append(img_640_n) image_data.append(imgh_910_n)
# 添加标签,假设这两张图片是两个类别,把他们标注为类型1和2 image_data_label = np.empty(2) image_data_label[0] = 1 image_data_label[1] = 2
# 把标签的类型转换成int类型,为了方便出来也把data转换成numpy.ndarray类型 image_data = np.array(image_data) image_data_label=image_data_label.astype(np.int) image_data_label
array([1, 2])
plt.imshow(image_data[1])
<matplotlib.image.AxesImage at 0x15ece1845f8>
# 把数据合并成一个元组进行保存 train_data = (image_data,image_data_label)
# 把数据写入pkl文件中 write_file=open('./input/train_data.pkl','wb') pickle.dump(train_data,write_file) write_file.close()
# 从pkl文件中读取图片数据和标签 read_file=open('./input/train_data.pkl','rb') (train_data,lab_data)=pickle.load(read_file) read_file.close()
# 查看读取出来的数据 train_data.shape
(2, 480, 640, 3)
lab_data
array([1, 2])
plt.imshow(train_data[0])
<matplotlib.image.AxesImage at 0x15ece1daa20>
到这里就完成了把图片加标签后存储与读取,为后续神经网络数据的输入作准备,当咱们须要数据的时候,把pkl文件加载进来就能够。git
github地址github