python实战-pdf文件转txt之类的文本可编辑类型文件

背景:最近刚好需要将一个pdf的内容打出来,这是个比较枯燥的内容,而且pdf里面的文字明显是规范的,所以想写个脚本读取内容,直接复制粘贴。刚好,python的理念就是不重复造轮子,这样的包自然是有的,这个脚本最主要的包就是pdfminer3k。 1.思路 解析出文档,按页存储进txt文件即可。 2.完整代码 from pdfminer.converter import PDFPageAggrega
相关文章
相关标签/搜索