做者|Andre Ye
编译|Flin
来源|towardsdatasciencepython
一般,数据科学家会创建一个图像识别模型,观察其准确性,若是足够高,就表示工做完成了。自从我13岁开始学习机器学习,我就一直不明白这一点。为何要花费全部的时间来创建最好的模型——只是为了知足于一个数字?shell
在本文中,我将提供代码并指导你如何经过构建与模型交互的拍照接口来真正完成项目。数组
咱们将使用的图像库是cv2。由于cv2不能在Kaggle这样的在线平台上工做,因此它必须在你的计算机上本地完成。然而,模型的权重仍然能够在Kaggle上进行训练,以.h5文件的形式下载(基于Keras/TensorFlow)并加载。网络
在Anaconda或命令提示符中键入app
conda create -n opencv python=3.6
这将在Python版本3.6中建立一个名为opencv的新环境,能够用正在使用的任何版本替换它。机器学习
下一步,输入ide
pip install opencv-python
你已经成功安装了cv2! 如今你能够开始拍照了。学习
首先,导入库。测试
import cv2
接下来,咱们必须建立一个视频捕获实例。你能够测试实例是否可以链接到你的相机(若是没有,请检查你的设置以确保应用程序能够访问它)。ui
cap = cv2.VideoCapture(0) if not (cap.isOpened()): print("Video device not connected.")
最后,是时候拍照了。若是要控制拍摄照片的时间,第一行将指定任意变量和输入。除非输入了某些内容(如按“回车”),而后下一行开始拍照,不然程序没法继续。拍摄图像时,你可能会看到网络摄像头指示灯很快出现。第三行关闭链接,第四行销毁访问相机的全部实例。
arb = input('Press enter to take picture.') ret, frame = cap.read() cap.release() cv2.destroyAllWindows()
图像中的数据存储在frame
中。能够使用如下代码将其转换为数组:
cv2_im = cv2.cvtColor(frame,cv2.COLOR_BGR2RGB)
调用cv2_im.shape
时,输出为(480640,3)。所以,图像(对于个人相机)是480×640像素(3表示“深度”, 每一个像素中有三个值说明建立最终像素颜色须要包含红色、绿色和蓝色)。
如今图像已转换为数组,matplotlib的imshow()能够显示它。
import matplotlib.pyplot as plt plt.imshow(cv2_im) plt.show()
完整代码:
import cv2 import matplotlib.pyplot as plt cap = cv2.VideoCapture(10) if not (cap.isOpened()): print("Video device unconnected.") arb = input('Press enter to take picture.') ret, frame = cap.read() cap.release() cv2.destroyAllWindows() cv2_im = cv2.cvtColor(frame,cv2.COLOR_BGR2RGB) plt.imshow(cv2_im) plt.show()
卷积神经网络只接受固定大小的图像,例如(100,100,3)。有几种方法能够作到这一点。
为了保持图像的比例长度,能够尝试裁剪图像。
通常语法是:
plt.imshow(cv2_im[y_upper_bound:y_lower_bound,x_lower_bound:x_higher_bound])
其中“upper”和“lower”由图像上的位置肯定(y
的“upper”表示图像的上方,x
的“upper”表示图像的右侧)。
例如,
plt.imshow(cv2_im[100:400,100:400])
这里把照片裁剪成正方形。
可是,尺寸仍然是300×300。为了解决这个问题,咱们将再次使用Pillow:
pil_image = Image.fromarray(cv2_im[100:400,100:400]) width = 100 height = 100 pil_image = pil_image.resize((width,height), Image.ANTIALIAS)
NumPy自动将Pillow图像转换为数组。
import numpy as np cv2_im_new = np.array(pil_image)
查看新图像:
plt.imshow(cv2_im_new)
好多了!图像的新形状是(100,100,3), 很是适合咱们的模型。
如今咱们有了NumPy数组,只需将其传递到模型中便可。
model.predict(cv2_im_new)
基于此,经过一些手动编码来标记图像的真实标签,能够在title中标记它们:
plt.imshow(cv2_im_new) plt.title('Hand Gesture: '+classification)
谢谢阅读!
在本教程中,你学习了如何实现一个简单的拍照界面,以查看你的机器学习模型的实际应用程序。
原文连接:https://towardsdatascience.co...
欢迎关注磐创AI博客站:
http://panchuang.net/
sklearn机器学习中文官方文档:
http://sklearn123.com/
欢迎关注磐创博客资源汇总站:
http://docs.panchuang.net/