office转PDF文档

最近项目上面有个需求,将用户上传的office格式转换成pdf格式。下面记录下我走过的一些弯路,和获得的一些收获 
     1 使用java第三方api转换。 
     这个是我最开始的想法,由于java毕竟比较熟悉,学习成本,维护成本相对较低。这个方案找过不少第三方,例如poi之类的,可是有两个缺点,1 性能低,对cpu压力大,2 兼容性差,不少格式或者特殊字符解析不出。 
     2 使用openOffice 
     openOffice也算是大名鼎鼎了,我使用的是另外一个分支libreoffice。这个方案是在linux服务器上安装openOffice而后经过openOffice命令来转换pdf。 
     性能问题基本解决,可是兼容性仍是太差,特别是windowsOffice不少特有 格式没法读取或者乱码,并且须要安装微软中文字体还有可能涉及到侵权。 
     3使用微软提供的com组件实现 
     微软提供一个叫作SaveAsPDFandXPS的com组建来实现office转换成pdf。 
     java经过jacob来调用com组件 
     具体实现 
     1 若是是web工程的话在jdk的bin目录下放置jacob-1.14.3-x64.dll 
     2 须要一台windows服务器,将该功能单独部署 
     3 这台windows服务须要安装office 和SaveAsPDFandXPS 
     方案优势, 解决性能问题,完美解决兼容性问题。 
     方案缺点, 需将转换服务单独部署,成为独立服务。须要windows服务器。须要实现linux系统和windows系统共享文件。这里感谢运维人员提供支持,经过磁盘挂载的方式实现共享文件。 
     
 
     实现流程为: 
    用户上传文件到web,web项目将用户上传的文件保存到文档服务器,而后调用部署在windows上的远程服务同时传递文件路径,该远程服务根据路径查找文档服务器上的文件并转换,然会返回相应的结果。 
    稍微注意就是,看业务需求是同步转换仍是异步转换,同步采用rpc机制调用远程服务,异步采用mq消息队列机制来实现远程服务调用。mq好处在于,能够最大化提高性能,由于能够经过队列来按顺序转换对应文件。java