准备工做:
一.编译环境: html
1. gcc gcc-c++ make(这个环境通常机器都具有,能够忽略)
linux
yum install gcc gcc-c++ make
2. 依赖的包: autoconf automake libtool libjpeg-devel libpng-devel libtiff-devel zlib-devel leptonica(1.67以上)c++
autoconf automake libtool libjpeg-devel libpng-devel libtiff-devel zlib-devel 能够经过yum安装:centos
yum install autoconf automake libtool yum install libjpeg-devel libpng-devel libtiff-devel zlib-devel
二. leptonica 须要源码编译安装ide
参考资料: 测试
http://paramountideas.com/tesseract-ocr-30-and-leptonica-installation-centos-55-and-opensuse-113 google
http://www.leptonica.org/source/README.html 编码
下载leptonica 包: http://www.leptonica.org/source/leptonica-1.68.tar.gzidea
解压后切换到leptonica-1.68 根目录 spa
./configure ;
make ; make install ;
三.tesseract安装:
依赖安装完毕后开始安装tesseract
下载tesseract-3.01 安装包: http://tesseract-ocr.googlecode.com/files/tesseract-3.01.tar.gz
解压后切换到tesseract-3.01 根目录
--若是在make时遇到相似strngs.h:1: error: stray '\357' in program 的错误,请将tesseract-3.01/ccutil/strngs.h 文件转为ANSI 编码保存,再从新编译
./autogen.sh ./configure make make install ldconfig
tesseract英文语言包安装:
下载tesseract-3.01 英文语言包: http://tesseract-ocr.googlecode.com/files/tesseract-ocr-3.01.eng.tar.gz
解压后将tesseract-ocr/tessdata 下的全部文件所有拷贝到/usr/local/share/tessdata 下
安装完毕.
测试一下:
切换到解压后的tesseract-3.01 根目录(这个目录下有一个自带的phototest.tif 能够作测试用)
命令行:
tesseract phototest.tif phototest -l eng
输出:
Tesseract Open Source OCR Engine v3.01 with Leptonica Page 0
这时应该在当前目录生成一个phototest.txt 文本文件,内容就是phototest.tif 显示的文字. 摘自 雪人的博客