OCR-Form-Tools项目试玩记录（一）本地部署

时间 2020-08-10

标签 ocr form tools 项目记录本地部署繁體版

原文原文链接

OCR-Form-Tools是微软的一个开源代码库，包含微软表单识别和OCR服务相关的多种工具。Github仓库地址前端

目前，表单标注工具（OCR Form Labeling Tool）是首个发布到本该仓库的工具。这篇博客记录了我尝试在本地部署并运行该工具的过程。node

方案一：使用官方Docker镜像（推荐）

官方提供了已经构筑好的docker镜像，若是本地配置了docker环境能够直接拉取并使用。这里参考官方文档react

配置docker环境的方法能够参考docker官网linux

# pull image
docker pull mcr.microsoft.com/azure-cognitive-services/custom-form/labeltool

# run image
docker run -it -p 3000:80 mcr.microsoft.com/azure-cognitive-services/custom-form/labeltool eula=accept

访问本地3000端口便可看到页面。git

须要注意，对于windows/macosx下使用Docker Toolbox的状况，docker运行在虚拟机上，因此须要访问虚拟机的3000端口才能看到页面（好比个人是http://192.168.99.100:3000/）。使用新版的docker desktop则没有这个问题github

方案二：本地编译

代码在手，直接编译并运行这个项目也是可行的。考虑到这个工具的主体是一个react前端应用，咱们须要借助npm等工具完成编译。docker

安装nodejs和npm

这个项目使用npm进行依赖管理，所以咱们首先须要安装npm。macos

windows用户能够从nodejs中文网下载。安装软件会自动完成环境变量配置等工做，直接按提示一路到底便可。npm

对于linux用户直接使用apt安装便可windows

sudo apt install nodejs npm -y

安装完毕后检查

node -v
npm -v

这里个人node版本是v10.16.0，npm版本是6.9.0，根据项目文档，node版本最好>=10.0，若是已经安装了更低版本的node能够考虑升级

（可选）配置npm镜像源为国内源

国内访问npm自带的官方软件源通常较慢，难如下载依赖，所以咱们能够将源换为国内源。

一个国内经常使用的开源镜像是淘宝NPM镜像

换源方法能够参考这篇博客：http://www.javashuo.com/article/p-qavzncqn-me.html

安装依赖并构筑应用

编译的工做参照仓库README说明便可。拉取代码

git clone https://github.com/microsoft/OCR-Form-Tools.git
cd OCR-Form-Tools

安装依赖。这一步时间较长，能够先去喝杯咖啡

npm install

编译并打包

npm run build

最后运行便可，若是成功会自动弹出浏览器并访问本地3000端口。

npm run react-start