windows(win10)下tesserocr的安装

windows下tesserocr的安装

首先说明下个人开发环境是win10+Anconda,python环境是使用的Anconda自带的python3.6版本html

安装tesseract

  1. 在Windows下,首先须要下载tesseract,它为tesserocr提供了支持。python

    下载地址是 https://digi.bib.uni-mannheim.de/tesseract/ git

  • 进入下载页面,能够看到有各类.exe文件的下载列表,其中文件名中带有dev的为开发版本,不带dev的为稳定版本,我本身选择下载的是tesseract-ocr-setup-3.05.01.exe
  • 下载完成后双击,此时会出现如下界面,此时能够勾选Additional language data(download)选项来安装OCR识别支持的语言包,这样OCR即可以识别多国语言,语言较多,下载时间会比较长,请耐心等待,而后一路点击Next按钮便可。
  1. 配置相应的环境变量github

    咱们须要配置两个环境变量一个是path环境变量,一个新建环境变量 TESSDATA_PREFIXwindows

    以下图所示:ide

    加入的值就是上面tesseract安装后所在的目录测试

  2. 设置完环境变量后,打开cmd窗口看可否识别tesseract,输入命令tesseract -vui

安装tesserocr

  1. 使用pip命令安装.net

    pip install tesserocr pillow命令行

    安装过程当中出现以下错误:

    解决办法是:

    • 打开连接https://github.com/simonflueckiger/tesserocr-windows_build/releases
    • 下载tesserocr-2.2.2-cp36-cp36m-win_amd64.whl文件,并将该文件放至 pip命令所在目录,我是使用的anconda环境个人目录路径C:\ProgramData\Anaconda3\Scripts
    • 而后在cmd命令行中 切换到该目录执行pip install tesserocr-2.2.2-cp36-cp36m-win_amd64.whl,为防止其余问题产生,最好用管理员身份打开cmd窗口,以下图所示即为安装成功

    测试

    1. 在cmd里面执行python命令,而后看可否正常导入tesserocr

    2. 下载须要识别的图片,https://raw.githubusercontent.com/Python3WebSpider/TestTess/master/image.png

    import tesserocr
    from PIL import Image
    image = Image.open('image.png')
    print(tesserocr.image_to_text(image))
    • 要把image.png 和代码放在同一个目录下,若是不是在同一个目录下须要修改open中的路径,须要注意的是若是是在pycharm中的话,要配置正确的python解析器,若是配置正确并且命令行中能正常导入的话,请重启pycharm,待包所有加载完毕以后,再次进行测试
    • 或者直接经过cmd命令行方式进行识别操做,须要注意的是img要在执行命令行时,所在的目录,好比下图所示个人图片是放在c盘的,全部我要先切换到c盘而后执行如下命令
    tesseract image.png result -l eng

感谢北京图灵学院老师的支持与帮助,感谢!!!! 官网 http://www.tulingxueyuan.com/ 交流QQ群 246519056

参考1 https://cuiqingcai.com/5189.html

参考2 https://blog.csdn.net/coolcooljob/article/details/80385711

相关文章
相关标签/搜索