python人工智能-图像识别

时间 2019-11-26

原文原文链接

1、安装库

首先咱们须要安装PIL和pytesseract库。 PIL：（Python Imaging Library）是Python平台上的图像处理标准库，功能很是强大。 pytesseract：图像识别库。python

我这里使用的是python3.6，PIL不支持python3因此使用以下命令git

pip install pytesseract
pip install pillow
复制代码

若是是python2，则在命令行执行以下命令：程序员

pip install pytesseract
pip install PIL
复制代码

这时候咱们去运行上面的代码会发现以下错误： github

错误提示的很明显： No such file or directory ："tesseract"bash

这是由于咱们没有安装tesseract-ocr引擎优化

2、tesseract-ocr引擎

光学字符识别(OCR,Optical Character Recognition)是指对文本资料进行扫描，而后对图像文件进行分析处理，获取文字及版面信息的过程。OCR技术很是专业，通常可能是印刷、打印行业的从业人员使用，能够快速的将纸质资料转换为电子资料。关于中文OCR，目前国内水平较高的有清华文通、汉王、尚书，其产品各有千秋，价格不菲。国外OCR发展较早，像一些大公司，如IBM、微软、HP等，即便没有推出单独的OCR产品，可是他们的研发团队早已掌握核心技术，将OCR功能植入了自身的软件系统。对于咱们程序员来讲，通常用不到那么高级的，主要在开发中可以集成基本的OCR功能就能够了。这两天我查找了不少免费OCR软件、类库，特意整理一下，今天首先来谈谈Tesseract，下一次将讨论下Onenote 2010中的OCR API实现。能够在这里查看OCR技术的发展简史。 Tesseract的OCR引擎最早由HP实验室于1985年开始研发，至1995年时已经成为OCR业内最准确的三款识别引擎之一。然而，HP不久便决定放弃OCR业务，Tesseract也今后尘封。数年之后，HP意识到，与其将Tesseract束之高阁，不如贡献给开源软件业，让其重焕新生－－2005年，Tesseract由美国内华达州信息技术研究所得到，并求诸于Google对Tesseract进行改进、消除Bug、优化工做。ui

###安装tesseract-ocr引擎spa

brew install tesseract
复制代码

而后咱们经过tesseract -v看一下是否安装成成功命令行

tesseract 3.05.01
leptonica-1.75.0
libjpeg 9b : libpng 1.6.34 : libtiff 4.0.9 : zlib 1.2.11
复制代码

这时候咱们运行上面代码会出现乱码这是由于tesseract默认只有语言包中没有中文包，以下图： 3d

###安装tesseract-ocr语言包咱们去GitHub下载咱们须要的语言包，这里我只下载了chi_tra.traineddata和chi_sim.traineddata github：tesseract-ocr/tessdata 而后放到/usr/local/Cellar/tesseract/3.05.01/share/tessdata路径下面。

能够经过tesseract --list-langs查看本地语言包：

能够经过tesseract --help-psm 查看psm

0：定向脚本监测（OSD） 1：使用OSD自动分页 2 ：自动分页，可是不使用OSD或OCR（Optical Character Recognition，光学字符识别） 3 ：全自动分页，可是没有使用OSD（默认） 4 ：假设可变大小的一个文本列。 5 ：假设垂直对齐文本的单个统一块。 6 ：假设一个统一的文本块。 7 ：将图像视为单个文本行。 8 ：将图像视为单个词。 9 ：将图像视为圆中的单个词。 10 ：将图像视为单个字符。

为何这里要强调语言包和psm，由于咱们在使用中会用到，好比多个语言包组合而且视为统一的文本块将使用以下参数： pytesseract.image_to_string(image,lang="chi_sim+eng",config="-psm 6") 这里咱们经过+来合并使用多个语言包。

接下来咱们看一下配置好一切的正确结果。

import pytesseract
from PIL import Image

image = Image.open("../pic/c.png")
code = pytesseract.image_to_string(image,lang="chi_sim",config="-psm 6")
print(code)
复制代码

此时大公告成。

喜欢的关注一下公众号，更多干货等你来哦！！！

扫码关注“伟大程序员的诞生”公众号，也期待你的来稿哦～～

公众号回复“资料获取”，获取更多干货哦～