虽然 Word DOCX 格式是建立文本文档的首选,但当咱们进入基于 Web 的领域时,它多是不够的。git
正如咱们在以前的文章中所讨论的,虽然 Word DOCX 格式是建立文本文档的首选,但当咱们进入基于 Web 的领域时,它多是不够的。在考虑格式化在线文档时,超文本标记语言 (HTML) 成为应用程序和网站的明显赢家之一。这种动态语言利用设置提示或元素来构建能够传输到浏览器并做为可读网页呈现给最终用户的文档。HTML 的结构甚至容许集成图像、交互式表单和其余更难用简单的 Word 文档建立的对象。github
Word DOCX 格式实际上基于不一样的标记语言 XML(可扩展标记语言)。微软在 2000 年代中期将其最受欢迎的程序——Word、Excel 和 PowerPoint——转变为开放标准、基于 XML 的格式。此举旨在改进文件大小、图像压缩和安全性,并保持领先于竞争对手的优点。虽然因为与其余平台兼容,一些用户仍然更喜欢旧的 DOC 版本,但 DOCX 格式一般是当前文字处理项目的更好选择。api
因为每种格式的细微差异,若是您尝试从 Word 文档中起草 HTML 代码,则与文件格式相关的附加格式和样式可能会阻碍其使用。除此以外,DOCX 设计的复杂性使得解析信息成为一项使人不快的任务。在本教程中,咱们将演示如何使用 Java 中的 API 将任何 DOCX 文件自动转换为 HTML,从而即时改进兼容性和产品质量。浏览器
首先,咱们将经过在 pom.xml 中添加对存储库的引用来安装 Maven:安全
<repositories> <repository> <id>jitpack.io</id> <url>https://jitpack.io</url> </repository> </repositories>
而后,咱们能够在 pom.xml 中添加对依赖项的引用:函数
<dependencies> <dependency> <groupId>com.github.Cloudmersive</groupId> <artifactId>Cloudmersive.APIClient.Java</artifactId> <version>v3.90</version> </dependency> </dependencies>
安装完成后,咱们准备将导入添加到咱们的控制器顶部并使用如下代码调用转换函数:学习
// Import classes: //import com.cloudmersive.client.invoker.ApiClient; //import com.cloudmersive.client.invoker.ApiException; //import com.cloudmersive.client.invoker.Configuration; //import com.cloudmersive.client.invoker.auth.*; //import com.cloudmersive.client.ConvertDocumentApi; ApiClient defaultClient = Configuration.getDefaultApiClient(); // Configure API key authorization: Apikey ApiKeyAuth Apikey = (ApiKeyAuth) defaultClient.getAuthentication("Apikey"); Apikey.setApiKey("YOUR API KEY"); // Uncomment the following line to set a prefix for the API key, e.g. "Token" (defaults to null) //Apikey.setApiKeyPrefix("Token"); ConvertDocumentApi apiInstance = new ConvertDocumentApi(); File inputFile = new File("/path/to/inputfile"); // File | Input file to perform the operation on. try { byte[] result = apiInstance.convertDocumentDocxToHtml(inputFile); System.out.println(result); } catch (ApiException e) { System.err.println("Exception when calling ConvertDocumentApi#convertDocumentDocxToHtml"); e.printStackTrace(); }
为确保流程正确运行,您须要输入几个参数:网站
文件 - 要对其执行操做的 DOCX 文件。
API 密钥 – 您的我的 API 密钥。若是您须要获取API key,您能够访问Cloudmersive网站注册一个免费帐号;这在咱们的 API 库中每个月提供 800 次调用。
该过程将返回一个 HTML 文档,该文档可轻松用于适用的网站和/或应用程序。url