python数据分析:PDFminer3k解析pdf为文字遇到:WARING:root:GBK-EUC-H

然后运行自己真正需要的PDF时,报错: 刚开始我天真的以为是pdf加密了,后来查了下发现pdfminer3k自带能解密一些简单的加密方法,且遇到加密报错不是这样的。 然后重新仔细研究报错,觉得应该是pdf的字体的问题,pdfminer3k不能解析特殊字体,需要下载相应的字体包来解决。 字体包下载网站:https://github.com/euske/pdfminer/pull/71/commits
相关文章
相关标签/搜索