这是一个最简单的图像识别,将图片加载后直接利用Python的一个识别引擎进行识别
将图片中的数字经过 pytesseract.image_to_string(image)
识别后将结果存入到本地的txt文件中
1 #-*-encoding:utf-8-*-
2 import pytesseract
3 from PIL import Image
4
5 class GetImageDate(object):
6 def m(self):
7 image = Image.open(u"a.png")
8 text = pytesseract.image_to_string(image)
9 return text
10
11 def SaveResultToDocument(self):
12 text = self.m()
13 f = open(u"Verification.txt","w")
14 print text
15 f.write(str(text))
16 f.close()
17
18 g = GetImageDate()
19 g.SaveResultToDocument()
具体想要实现上面的代码须要安装两个包和一个引擎
在安装以前须要先安装好Python,pip并配置好环境变量
全部包的安装都是经过pip来安装的,须要在windows PowerShell中进行,而且是在 C:\Python27\Scripts目录下
1.第一个包: pytesseract
pip install pytesseract
如果出现安装错误的状况,安装不了的时候,能够将命令改成 pip.exe install pytesseract来安装
如果将pip修改成pip.exe安装成功后,那么下文的全部pip都须要改成pip.exe
2.第二个包:PIL安装
pip install PIL
如果失败了能够以下修改 pip install PILLOW
3.安装识别引擎tesseract-ocr
https://github.com/tesseract-ocr/tesseract
下载 tesseract-ocr,进行默认安装
安装完成后须要配置环境变量,在系统变量path后增长 tesseract-ocr的安装地址C:\Program Files (x86)\Tesseract-OCR;
一切都安装完成后运行上述代码,会发现报错,此时须要
至此结束