Linux服务器下部署安装PaddleOCR

以下步骤是Linux服务器部署过程,并无git文档上那么复杂

部署PaddleOCR项目github参考文档:

https://github.com/PaddlePaddle/PaddleOCR/blob/develop/doc/doc_ch/installation.md

https://github.com/PaddlePaddle/PaddleOCR/blob/develop/deploy/hubserving/readme.md

 

1、安装Python 3.7版本

(本人安装的是3.7.9版本,更高版本不知有无问题)

登录官网下载https://www.python.org/

因为部署在linux的服务器上,就下载相应的linux安装包。

 

这里我选择下载Python3.7.9,下载的文件后缀名是.tgz的;你也可以尝试下载其他3.7以上版本;

 

 

具体linux下的python3.7安装教程,百度搜或者参考下面链接的教程

https://blog.csdn.net/qq_43422918/article/details/92793263

 

2、安装PaddlePaddle Fluid V2.0

   python3 -m pip install paddlepaddle==2.0.0b0 -i https://pypi.tuna.tsinghua.edu.cn/simple

【下载过程中经常下载失败,建议在早上人少时尝试下载,或多试几次下载】

 

3、下载项目代码到指定目录

wget https://github.com/PaddlePaddle/PaddleOCR/archive/develop.zip

unzip develop.zip # 解压

也可以到https://github.com/PaddlePaddle/PaddleOCR下载后,将PaddleOCR项目随意上传到服务器某目录下;

 

 

4、安装项目依赖库:

在步骤3上传完PaddleOCR项目后,进入到/../../PaddleOCR目录下

执行命令:   pip3 install -r requirments.txt

 

【注】安装过程如出现下面报错,这个是因为你的linux没有patch命令,

执行命令:yum -y install patch

然后重新执行:pip3 install -r requirments.txt

 

5、安装paddlehub

   pip3 install paddlehub --upgrade -i https://pypi.tuna.tsinghua.edu.cn/simple

【下载过程中经常下载失败,建议在早上人少时尝试下载,或多执行几次】

 

6、设置环境变量(PaddleOCR项目的存储路径,步骤3上传的)

   export PYTHONPATH=/../../PaddleOCR

 

7、安装服务模块:(根据需要安装,主要是第三个安装成功就可以)

进入到PaddleOCR目录,执行命令

# 安装检测服务模块:  

hub install deploy/hubserving/ocr_det/

# 安装识别服务模块:  

hub install deploy/hubserving/ocr_rec/

# 安装检测+识别串联服务模块:  

hub install deploy/hubserving/ocr_system/

 

【注1】安装过程3个都有如下报错提示,可忽略;

 

【注2】安装第二个有提示报错,也忽略;只要第3个安装成功就可以;

 

 

8、启动服务

进入到PaddleOCR目录下(启动参数修改可参考https://github.com/PaddlePaddle/PaddleOCR/blob/develop/deploy/hubserving/readme.md) 

执行命令启动服务: hub serving start -c config.json  

 

【注】若提示下图的Port 8083 is occupied, please change it.是端口被占用了,

进入PaddleOCR目录下,

vim config.json打开配置文件更改端口号(也可以用WinSCP工具去更改文件)

更改后:wq保存退出;

然后重新执行命令启动服务;

 

9、验证服务

(可参考https://github.com/PaddlePaddle/PaddleOCR/blob/develop/deploy/hubserving/readme.md)

 

把带文字的图片放到你设定的目录下,例如/data/imgs/

执行命令:

python3 tools/test_hubserving.py http://127.0.0.1:8083/predict/ocr_system /data/imgs/

 

【注1】127.0.0.1:8083中的8083要改成你设置的端口号,如上面的127.0.0.1:8099;

【注2】/doc/imgs/ 可以改为你放置图片的实际路径  ,后面加文件名或不加文件名都可以;