ActiveMQ传输文件的几种方式原理与优劣

时间 2019-11-10

原文原文链接

本文讨论ActiveMQ传输文件的几种方法的原理及其利弊，做为消息发送、直接传输文件、使用ftp或http中转。最后介绍扩展ActiveMQ实现自定义文件传输方式，讨论如何实现高效的文件传输。by kimmkinghtml

做为消息发送

按照JMS规范，为了保证可靠性，全部的消息都应该是发送到broker，而后交由broker来投递的。也便是说其实JMS是不建议或不支持传输文件的。数据库

对于比较小的文件，简单的处理方式是先读取全部的文件成byte[]，而后使用ByteMessage，把文件数据发送到broker，像正常的message同样处理。对于大文件，例如1GB以上的文件，这么搞直接把client或是broker给oom掉了。apache

这种方式仅仅适用于小文件的传输。特别是若是broker端使用数据库做为存储，message序列化之后存放于blob字段，文件传输频繁或是稍微有点大，写入效率极低。服务器

直接传输文件

为了解决传输大文件的问题，ActiveMQ在jms规范以外引入了jms streams的概念。PTP模式下，连到同一个destination的两端，能够经过broker中转来传输大文件。session

发送端使用connection.createOutputStream打开一个输出流，往流里写文件。tcp

OutputStream out =connection.createOutputStream(destination);大数据

接收端则简单的使用connection.createInputStream拿到一个输入流，从中读取文件数据便可。url

InputStream in = connection.createInputStream(destination)

详见：http://activemq.apache.org/jms-streams.htmlspa

使用很是简单。ActiveMQ在中间作了什么事情呢？代理

其实过程蛮曲折的，发送端拿到文件后，首先分片，默认64K文件数据为一个byte message，而后依次把全部的message发送到broker，broker转发给接收端，最后发送一个空消息做为结束符。

connection上提供了两个建立OutputStream的方法，一个是createOutputStream建立的是持久化的消息集合，这些数据会写到磁盘或是数据库（对大文件来讲慢消费也是一件可怕的事儿）；一个是createNonPersistOutputStream建立的是非持久化消息集合，不会写到磁盘上，若是没有及时消费掉就惨了。

文件片断的byte message的TTL设置为0，就是不会超时进入DLQ。

优点：简单直接，处理很是小（不大于64K）的文件很是方便。

劣势：对大文件，简直就是噩梦。

文件中转方式

使用消息的方式来传递大文件，明显不是一个有效率的办法。文件应该就是按文件的方式去处理。

本身处理中转

若是本身处理文件的话，一个简单方式是使用共享或ftp、dfs等方式，先把文件发送到一个你们均可以拿到的地方，而后发送message，payload或properties中包含文件的路径信息。这样，consumer拿到文件路径后去指定的地方，按照给定的方式去获取文件数据便可。

优点：这种方式能够用来处理大数据，而且不须要client或broker在内存中持有文件数据自己，很是的节省资源。并且文件是经过额外的方式处理，跟ActiveMQ自己无关，因此符合jms协议、处理的效率也相对比较高。

劣势：须要本身处理不少文件相关的操做。

BlobMessage对文件中转的封装

幸运的是，ActiveMQ把上面繁复的文件处理工做进行了封装，屏蔽掉文件中转的整个处理过程，使得咱们可使用相似jms规范的API来简单操做文件传输。

举个例子来讲，典型的使用步骤：

发送端：

1. 启动ActiveMQ时，也启动jetty(即activemq.xml中有import jetty.xml)，此时jetty中运行了一个ActiveMQ自带的http文件服务器

2. 使用tcp://localhost:61616?jms.blobTransferPolicy.defaultUploadUrl=http://localhost:8161/fileserver/建立connection，而后建立session和producer

3. 使用以下代码发送文件：

BlobMessageblobMessage = session.createBlobMessage(file);

blobMessage.setStringProperty("FILE.NAME",file.getName());

blobMessage.setLongProperty("FILE.SIZE",file.length());

producer.send(blobMessage);

接收端比较简单，正常的使用jms接收到消息：

InputStream inputStream = blobMessage.getInputStream();

而后直接读取文件数据便可。文件名和文件大小能够从message的属性中拿到。

这个过程当中ActiveMQ作了什么呢？

发送端：producer.send的时候，把文件经过http协议的PUT方法发到jetty中的fileserver（默认128K走http的chunk分片传输）。而后把http的url写入消息中。再把消息发送到broker。

接收端：接收到消息之后，发现是BlobMessage，拿到url，直接使用GET方法获取文件数据。处理完毕后，使用DELETE方法从fileserver删除文件。

BlobMessage支持3种文件中转方式：

FILE

要求client和broker在同一个机器或者使用同一个共享存储。发送文件的时候，把文件从本地写入到指定路径。接收文件的时候，把文件今后路径读出来。

HTTP

使用http的fileserver，PUT/GET/DELETE方法。ActiveMQ自带了简单的实现。就是前面场景中使用的方式。

FTP

使用一个独立的ftpserver做为文件中转方式。发送文件的时候，把文件发送到ftp服务器。接收文件的时候，从ftp把文件读取下来。

详见：http://activemq.apache.org/blob-messages.html

优点：消息处理与文件处理传输分开，极大的提升了文件传输的效率。并且可使用相似jms协议的方式来处理文件发送。

劣势：FILE方式不太实用。HTTP和FTP方式都须要额外的fileserver。

自定义文件传输方式

ActiveMQ实现BlobMessage的三种文件中转方式时，使用了Façade和Strategy模式。ActiveMQBlobMessage须要在发送消息时使用blobUploader上传文件、接收消息时使用blobDownloader下载文件。每种中转方式的这两个操做分别使用BlobUploadStrategy和BlobDownloadStrategy封装。

因此，咱们也能够根据ActiveMQBlobMessage文件传送的原理，实现本身的定制方式：

一、给ActiveMQBlobMessage添加本身的blobDownloader和blobUploader来实现文件的处理。

二、扩展这个文件中起色制，实现BlobUploadStrategy和BlobDownloadStrategy。

一个更高效且不须要额外fileserver的实现思路是：broker上再打开一个tcp的监听端口，用来接收和转发文件，当发送和接收端都在时，broker仅仅做为一个传输代理。接收端不在时，broker把数据存为本地临时文件，处理完毕后删除掉。之因此使用一个新的端口来传输文件数据而不是已有的transport，是为了不jms streams这种命令和数据混合的模式。能够参考ftp协议，做为一种高效的文件传输协议，它有一个很大的特色就是命令的处理，和数据传输的处理使用不一样的端口和链接。而ActiveMQ使用的openwire协议其实就是一个个的操做命令。文件分片、包装、序列化，到另外一头再反向这个过程，无疑是效率很低下的