nodejs将PDF文件转换成txt文本,并利用python处理转换后的文本文件

目前公司Web服务端的开发是用Nodejs,所以开发功能的话首先使用Nodejs,这也是为什么不直接用python转换的原因。 由于node对文本的处理(提取所需信息)的能力不强,类似于npm上的包:‘linebyline’、'lineReader',处理能力都不强,所以使用python来处理。   目的:提取PDF中带有‘检查'字样的文本(行) 思路: 1、Nodejs 找到PDF转换text的
相关文章
相关标签/搜索