PDF是当今最流行的文档格式之一,各类应用程序将其用做最终输出。因为支持多种数据类型和可移植性,所以它是建立和共享内容的首选格式。做为对开发文档管理应用程序感兴趣的.NET应用程序开发人员,可能但愿嵌入处理功能,以读取PDF文档并将其转换为其余文件格式,例如HTML。html
下面,来探索并演示一下Aspose.PDF for .NET API的强大转换功能,以使用多种选项读取PDF文件并将其转换为HTML。编码
只需使用几行代码和资源加载回调就能够以很是基本的方式将HTML转换为PDF,如下是使您达到目的的代码段:spa
// The path to the documents directory. string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion(); HtmlLoadOptions options = new HtmlLoadOptions(); options.CustomLoaderOfExternalResources = new LoadOptions.ResourceLoadingStrategy(SamePictureLoader); Document pdfDocument = new Document(dataDir + "HTMLToPDF.html", options); pdfDocument.Save("HTMLToPDF_out.pdf");
可使用如下示例代码在将PDF转换为HTML的过程当中,将上述步骤中的HTML分为多个页面。htm
// The path to the documents directory. string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion(); // Open the source PDF document Document pdfDocument = new Document(dataDir + "PDFToHTML.pdf"); // Instantiate HTML SaveOptions object HtmlSaveOptions htmlOptions = new HtmlSaveOptions(); // Specify to split the output into multiple pages htmlOptions.SplitIntoPages = true; // Save the document pdfDocument.Save(@"MultiPageHTML_out.html", htmlOptions);
将SplitIntoPages标志设置为true能够为您完成全部工做,而且输出HTML由多个页面而不是单个页面组成。ip
PDF文档除了文本详细信息外还能够包含图像。HTML能够包含HTML内基于64位编码的图像,也能够引用这些图像所在的文件夹中的图像。Aspose.PDF API具备丰富的功能,能够将图像保存到光盘上用户指定的文件夹中。如下代码示例显示了在将PDF转换为HTML的过程当中如何将图像保存到特定文件夹。ci
// Create HtmlSaveOption with tested feature HtmlSaveOptions newOptions = new HtmlSaveOptions(); // Specify the separate folder to save images newOptions.SpecialFolderForAllImages = dataDir;
若是你对Aspose的产品感兴趣或有任何技术难题均可以加入Aspose交流群(642018183)资源