python 图像识别

时间 2019-11-20

标签 python 图像识别栏目 Python 繁體版

原文原文链接

这是一个最简单的图像识别，将图片加载后直接利用Python的一个识别引擎进行识别

将图片中的数字经过 pytesseract.image_to_string(image) 识别后将结果存入到本地的txt文件中

 1 #-*-encoding:utf-8-*-
 2 import pytesseract
 3 from PIL import Image
 4 
 5 class GetImageDate(object):
 6     def m(self):
 7         image = Image.open(u"a.png")
 8         text = pytesseract.image_to_string(image)
 9         return text
10 
11     def SaveResultToDocument(self):
12         text = self.m()
13         f = open(u"Verification.txt","w")
14         print text
15         f.write(str(text))
16         f.close()
17 
18 g = GetImageDate()
19 g.SaveResultToDocument()

具体想要实现上面的代码须要安装两个包和一个引擎

在安装以前须要先安装好Python，pip并配置好环境变量

全部包的安装都是经过pip来安装的，须要在windows PowerShell中进行，而且是在 C:\Python27\Scripts目录下

1.第一个包： pytesseract

pip install pytesseract

如果出现安装错误的状况，安装不了的时候，能够将命令改成 pip.exe install pytesseract来安装

如果将pip修改成pip.exe安装成功后，那么下文的全部pip都须要改成pip.exe

2.第二个包：PIL安装

pip install PIL

如果失败了能够以下修改 pip install PILLOW

3.安装识别引擎tesseract-ocr

https://github.com/tesseract-ocr/tesseract

下载 tesseract-ocr，进行默认安装

安装完成后须要配置环境变量，在系统变量path后增长 tesseract-ocr的安装地址C:\Program Files (x86)\Tesseract-OCR；

一切都安装完成后运行上述代码，会发现报错，此时须要

至此结束