为图像识别模型构建图像采集接口应用程序

时间 2020-08-18

标签图像识别模型构建采集接口应用程序栏目网络爬虫繁體版

原文原文链接

做者|Andre Ye
编译|Flin
来源|towardsdatasciencepython

一般，数据科学家会创建一个图像识别模型，观察其准确性，若是足够高，就表示工做完成了。自从我13岁开始学习机器学习，我就一直不明白这一点。为何要花费全部的时间来创建最好的模型——只是为了知足于一个数字?shell

在本文中，我将提供代码并指导你如何经过构建与模型交互的拍照接口来真正完成项目。数组

安装cv2（OpenCV）

咱们将使用的图像库是cv2。由于cv2不能在Kaggle这样的在线平台上工做，因此它必须在你的计算机上本地完成。然而，模型的权重仍然能够在Kaggle上进行训练，以.h5文件的形式下载(基于Keras/TensorFlow)并加载。网络

在Anaconda或命令提示符中键入app

conda create -n opencv python=3.6

这将在Python版本3.6中建立一个名为opencv的新环境，能够用正在使用的任何版本替换它。机器学习

下一步，输入ide

pip install opencv-python

你已经成功安装了cv2! 如今你能够开始拍照了。学习

用CV2拍照

首先，导入库。测试

import cv2

接下来，咱们必须建立一个视频捕获实例。你能够测试实例是否可以链接到你的相机（若是没有，请检查你的设置以确保应用程序能够访问它）。ui

cap = cv2.VideoCapture(0)
if not (cap.isOpened()):
    print("Video device not connected.")

最后，是时候拍照了。若是要控制拍摄照片的时间，第一行将指定任意变量和输入。除非输入了某些内容（如按“回车”），而后下一行开始拍照，不然程序没法继续。拍摄图像时，你可能会看到网络摄像头指示灯很快出现。第三行关闭链接，第四行销毁访问相机的全部实例。

arb = input('Press enter to take picture.')
ret, frame = cap.read()
cap.release()
cv2.destroyAllWindows()

图像中的数据存储在frame中。能够使用如下代码将其转换为数组：

cv2_im = cv2.cvtColor（frame，cv2.COLOR_BGR2RGB）

调用cv2_im.shape时，输出为（480640，3）。所以，图像（对于个人相机）是480×640像素（3表示“深度”, 每一个像素中有三个值说明建立最终像素颜色须要包含红色、绿色和蓝色）。

如今图像已转换为数组，matplotlib的imshow()能够显示它。

import matplotlib.pyplot as plt
plt.imshow(cv2_im)
plt.show()

完整代码：

import cv2
import matplotlib.pyplot as plt
cap = cv2.VideoCapture(10)
if not (cap.isOpened()):
    print("Video device unconnected.")
arb = input('Press enter to take picture.')
ret, frame = cap.read()
cap.release()
cv2.destroyAllWindows()
cv2_im = cv2.cvtColor(frame,cv2.COLOR_BGR2RGB)
plt.imshow(cv2_im)
plt.show()

格式化为模型标准

卷积神经网络只接受固定大小的图像，例如（100，100，3）。有几种方法能够作到这一点。

为了保持图像的比例长度，能够尝试裁剪图像。

通常语法是：

plt.imshow(cv2_im[y_upper_bound:y_lower_bound,x_lower_bound:x_higher_bound])

其中“upper”和“lower”由图像上的位置肯定（y的“upper”表示图像的上方，x的“upper”表示图像的右侧）。

例如，

plt.imshow(cv2_im[100:400,100:400])

这里把照片裁剪成正方形。

可是，尺寸仍然是300×300。为了解决这个问题，咱们将再次使用Pillow：

pil_image = Image.fromarray(cv2_im[100:400,100:400])
width = 100
height = 100
pil_image = pil_image.resize((width,height), Image.ANTIALIAS)

NumPy自动将Pillow图像转换为数组。

import numpy as np
cv2_im_new = np.array(pil_image)

查看新图像：

plt.imshow(cv2_im_new)

好多了！图像的新形状是(100，100，3), 很是适合咱们的模型。

在模型中运行

如今咱们有了NumPy数组，只需将其传递到模型中便可。

model.predict(cv2_im_new)

基于此，经过一些手动编码来标记图像的真实标签，能够在title中标记它们：

plt.imshow(cv2_im_new)
plt.title('Hand Gesture: '+classification)

谢谢阅读！

在本教程中，你学习了如何实现一个简单的拍照界面，以查看你的机器学习模型的实际应用程序。

原文连接：https://towardsdatascience.co...

欢迎关注磐创AI博客站：
http://panchuang.net/

sklearn机器学习中文官方文档：
http://sklearn123.com/

欢迎关注磐创博客资源汇总站：
http://docs.panchuang.net/