用pdftohtml将PDF转成HTML

pdftohtml一样是超强命令行工具集poppler的一个子集,和pdfimages等优秀的子集同样。用好了是很是便利的。html 须要理解的是,pdftohtml对扫描版PDF是没什么用对。它的主要功能是把pdf中元素所有提取出来,而后按照布局生成HTML。可是扫描版的至关因而一张图片,没有任何元素信息。工具 Mac上,直接homebrew:布局 $ brew install poppler
相关文章
相关标签/搜索