OCR-Form-Tools是微软的一个开源代码库,包含微软表单识别和OCR服务相关的多种工具。Github仓库地址前端
目前,表单标注工具(OCR Form Labeling Tool)是首个发布到本该仓库的工具。这篇博客记录了我尝试在本地部署并运行该工具的过程。node
官方提供了已经构筑好的docker镜像,若是本地配置了docker环境能够直接拉取并使用。这里参考官方文档react
配置docker环境的方法能够参考docker官网linux
# pull image docker pull mcr.microsoft.com/azure-cognitive-services/custom-form/labeltool # run image docker run -it -p 3000:80 mcr.microsoft.com/azure-cognitive-services/custom-form/labeltool eula=accept
访问本地3000端口便可看到页面。git
须要注意,对于windows/macosx下使用Docker Toolbox的状况,docker运行在虚拟机上,因此须要访问虚拟机的3000端口才能看到页面(好比个人是http://192.168.99.100:3000/)。使用新版的docker desktop则没有这个问题github
代码在手,直接编译并运行这个项目也是可行的。考虑到这个工具的主体是一个react前端应用,咱们须要借助npm等工具完成编译。docker
这个项目使用npm进行依赖管理,所以咱们首先须要安装npm。macos
windows用户能够从nodejs中文网下载。安装软件会自动完成环境变量配置等工做,直接按提示一路到底便可。npm
对于linux用户直接使用apt安装便可windows
sudo apt install nodejs npm -y
安装完毕后检查
node -v npm -v
这里个人node版本是v10.16.0,npm版本是6.9.0,根据项目文档,node版本最好>=10.0,若是已经安装了更低版本的node能够考虑升级
国内访问npm自带的官方软件源通常较慢,难如下载依赖,所以咱们能够将源换为国内源。
一个国内经常使用的开源镜像是淘宝NPM镜像
换源方法能够参考这篇博客:http://www.javashuo.com/article/p-qavzncqn-me.html
编译的工做参照仓库README说明便可。拉取代码
git clone https://github.com/microsoft/OCR-Form-Tools.git cd OCR-Form-Tools
安装依赖。这一步时间较长,能够先去喝杯咖啡
npm install
编译并打包
npm run build
最后运行便可,若是成功会自动弹出浏览器并访问本地3000端口。
npm run react-start