PDF开发工具Aspose.PDF功能推荐——在.NET中将PDF转换为HTML

时间 2019-11-07

标签 pdf 开发工具 aspose.pdf aspose 功能推荐中将转换 html 栏目 HTML 繁體版

原文原文链接

PDF是当今最流行的文档格式之一，各类应用程序将其用做最终输出。因为支持多种数据类型和可移植性，所以它是建立和共享内容的首选格式。做为对开发文档管理应用程序感兴趣的.NET应用程序开发人员，可能但愿嵌入处理功能，以读取PDF文档并将其转换为其余文件格式，例如HTML。html

下面，来探索并演示一下Aspose.PDF for .NET API的强大转换功能，以使用多种选项读取PDF文件并将其转换为HTML。编码

将HTML转换到PDF

只需使用几行代码和资源加载回调就能够以很是基本的方式将HTML转换为PDF，如下是使您达到目的的代码段：spa

// The path to the documents directory.
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion();

HtmlLoadOptions options = new HtmlLoadOptions();
options.CustomLoaderOfExternalResources = new LoadOptions.ResourceLoadingStrategy(SamePictureLoader);

Document pdfDocument = new Document(dataDir + "HTMLToPDF.html", options);
pdfDocument.Save("HTMLToPDF_out.pdf");

将PDF转换为多页HTML

可使用如下示例代码在将PDF转换为HTML的过程当中，将上述步骤中的HTML分为多个页面。htm

// The path to the documents directory.
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion();

// Open the source PDF document
Document pdfDocument = new Document(dataDir + "PDFToHTML.pdf");

// Instantiate HTML SaveOptions object
HtmlSaveOptions htmlOptions = new HtmlSaveOptions();

// Specify to split the output into multiple pages
htmlOptions.SplitIntoPages = true;

// Save the document
pdfDocument.Save(@"MultiPageHTML_out.html", htmlOptions);

将SplitIntoPages标志设置为true能够为您完成全部工做，而且输出HTML由多个页面而不是单个页面组成。ip

将图像保存到特定文件夹

PDF文档除了文本详细信息外还能够包含图像。HTML能够包含HTML内基于64位编码的图像，也能够引用这些图像所在的文件夹中的图像。Aspose.PDF API具备丰富的功能，能够将图像保存到光盘上用户指定的文件夹中。如下代码示例显示了在将PDF转换为HTML的过程当中如何将图像保存到特定文件夹。ci

// Create HtmlSaveOption with tested feature
HtmlSaveOptions newOptions = new HtmlSaveOptions();

// Specify the separate folder to save images
newOptions.SpecialFolderForAllImages = dataDir;

若是你对Aspose的产品感兴趣或有任何技术难题均可以加入Aspose交流群（642018183）资源