PDF是将文档发送给第三方的最经常使用格式之一。形成这种流行的缘由是PDF跨多个平台的兼容性,而不考虑任何硬件/软件要求。可是,在某些状况下,可能但愿将PDF文档转换为可编辑的文档格式。编程
在这种状况下, PDF到Word DOC或DOCX多是优先级转换选项。为了使转换过程自动化,本文将展现如何在Java中以编程方式将PDF转换为Word。若是你尚未升级Aspose.PDF最新版测试,能够点击这里下载。测试
在本文中,咱们将使用Aspose.PDF在Java中执行如下PDF到DOC/DOCX的转换:spa
在应用程序中引用了Java的Aspose.PDF以后,能够经过几行代码将任何PDF文档转换为DOC格式。如下是执行此转换所需的步骤。3d
如下代码示例显示了如何在Java中将PDF转换为DOC。orm
// Load source PDF file Document doc = new Document("input.pdf"); // Save resultant DOC file doc.save("output.doc", SaveFormat.Doc);
输入的PDF文件blog
转换后的Excel文档文档
DOCX是Word文档的一种众所周知的格式,与DOC格式相反,DOCX的结构基于二进制文件和XML文件。若是要将PDF转换为DOCX格式,可使用Document.save()方法中的SaveFormat.DocX参数告诉API这样作。get
如下代码示例显示了如何在Java中将PDF转换为DOCX。input
// Load source PDF file Document doc = new Document("input.pdf"); // Save resultant DOCX file doc.save("output.docx", SaveFormat.DocX);
Aspose.PDF for Java还提供了一些其余选项,能够在PDF到Word的转换中使用这些选项,例如输出格式,图像分辨率,文本行之间的距离等。DocSaveOptions类用于此目的,如下是您可使用的选项列表:it
下面的代码示例演示如何使用Java将PDF中的DocSaveOptions类转换为DOCX。
// Load source PDF file Document doc = new Document("input.pdf"); // Instantiate DocSaveOptions instance DocSaveOptions saveOptions = new DocSaveOptions(); // Set output format saveOptions.setFormat(DocSaveOptions.DocFormat.DocX); // Set the recognition mode as Flow saveOptions.setMode(DocSaveOptions.RecognitionMode.Flow); // Set the horizontal proximity as 2.5 saveOptions.setRelativeHorizontalProximity(2.5f); // Enable bullets recognition during conversion process saveOptions.setRecognizeBullets(true); // Save resultant DOCX file doc.save("resultant.docx", saveOptions);