java读取pdf中数据,包含表格和图片

任务是提取pdf文件中的数据,并将其转化到csv格式的文件中。java 首先用到的工具为开源jar包:pdfbox,因为pdf中没有表结构,且要提取的pdf文件格式固定,pdfbox提供extractbyarea方法,因此经过坐标能够提取表格中每一列的数据,好像方法挺笨的,可是没找到其余跟好的方法。工具 关于java操做pdf,在网上看到好多人说itext比pdfbox方便,功能强大,可是itex
相关文章
相关标签/搜索