ActiveMQ 消息存储

深刻浅出 JMS(四) - ActiveMQ 消息存储

 1、消息的存储方式

ActiveMQ 支持 JMS 规范中的持久化消息与非持久化消息mysql

  • 持久化消息一般用于不论是否消费者在线,它们都会保证消息会被消费者消费。当消息被确认消费后,会从存储中删除
  • 非持久化消息一般用于发送通知以及实时数据,一般要求性能优先,消息可靠性并非必须的状况
  • MQ 支持可插拔式的消息存储,如:内存、文件和关系数据库等方式

Queue 消息模型在 ActiveMQ 的存储:sql

  采用存储采用先进先出(FIFO),一个消息只能被一个消费者消费,当消息被确认消费以后才会被删除。数据库

Topic消息模型(针对持久订阅):apache

  每一个订阅者获取的消息实际是消息的一个副本,只有一个消息副本会被存储,MQ 提供了一个指针来指向消息存储而且分发消息副本到订阅者,消息直到全部的持久化订阅者都被接收才能被删除。缓存

持久化存储方式:服务器

  • KahaDB 消息存储
  • AMQ 消息存储
  • JDBC 消息存储
  • 内存消息存储

2、KahaDB 存储方式

  KahaDB 是从 ActiveMQ 5.4 开始默认的持久化插件。KahaDb 恢复时间远远小于其前身 AMQ 而且使用更少的数据文件,因此能够彻底代替 AMQ,kahaDB 的持久化机制一样是基于日志文件,索引和缓存。性能

(一)KahaDB 主要特性:

  • 日志形式存储消息;
  • 消息索引以 B-Tree 结构存储,能够快速更新;
  • 彻底支持 JMS 事务;
  • 支持多种恢复机制;

(二)适用场景:

高吞吐量的应用程序
存储大数据量的消息大数据

(三)配置方式 conf/activemq.xml:

<persistenceAdapter> <kahaDB directory="${activemq.data}/kahadb"/> </persistenceAdapter>

图4.1 KahaDB

(四)KahaDB 存储原理

当有活动消费者时,用于临时存储,消息会被发送给消费着,同时被安排将被存储,若是消息及时被确认,就不须要写入到磁盘。写入到磁盘中的数据消息,在后续的消息活动中,若是消息发送成功,变标记为可删除的。系统会周期性的清除或者归档日志文件。url

(1) KahaDB 内部结构

图4.1 KahaDB内部结构

  • Data logs:消息日志包含了消息日志和一些命令
  • Cache:当有活动消费者时,用于临时存储,消息会被发送给消费着,同时被安排将被存储,若是消息及时被确认,这不须要写入到磁盘
  • Btree indexes(消息索引):用于引用消息日志(message id),它存储在内存中,这样能快速定位到。MQ会按期将内存中的消息索引保存到 metadata store 中,避免大量消息未发送时,消息索引占用过多内存空间。
  • Redo log:用于在非正常关机状况下维护索引完整性。

(2) 目录结构

图4.1 KahaDB目录结构

  • Db log files:用于存储消息(默认大小32M),当 log 日志满了,会建立一个新的,当 log 日志中的消息都被删除,该日志文件会被删除或者归档。
  • Archive directory:当 datalog 不在被 kahadb 须要会被归档(经过 archiveDataLogs 属性控制)。
  • Db.data:存放 Btree indexs。
  • Db.redo:存放 redo file,用于恢复 Btree indexs。

3、AMQ 消息存储

写入消息时,会将消息写入日志文件,因为是顺序追加写,性能很高。为了提高性能,建立消息主键索引,而且提供缓存机制,进一步提高性能。每一个日志文件的大小都是有限制的(默认32m,可自行配置)。当超过这个大小,系统会从新创建一个文件。当全部的消息都消费完成,系统会删除这个文件或者归档(取决于配置)。主要的缺点是 AMQ Message 会为每个 Destination 建立一个索引,若是使用了大量的 Queue,索引文件的大小会占用不少磁盘空间。并且因为索引巨大,一旦 Broker 崩溃,重建索引的速度会很是慢。spa

特色:相似 KahaDB,也包含了事务日志,每一个 destination 都包含一个 index 文件,AMQ 适用于高吞吐量的应用场景,可是不适合多个队列的场景。

配置方式 conf/activemq.xml:

<!--AMQ directory:数据存储路径 syncOnWrite:是否同步写入 maxFileLength:日志文件大小 --> <persistenceAdapter> <amqPersistenceAdapter directory="${activemq.data}/AMQdb" syncOnWrite="true" maxFileLength="10mb" /> </persistenceAdapter>

(1) AMQ内部结构

图4.3 AMQ内部结构

  • Data logs:消息日志包含了消息日志
  • Cache:用于消息的快速检索
  • Reference store indexes:用于引用 datalogs 中的消息,经过 message ID 关联

(2) 目录结构

图4.4 AMQ目录结构

  • Lock:保证同一时间只有一个 borker 访问文件目录
  • temp-storag:用于存储非持久化消息(当不在被存储在内存中),如等待慢消费者处理消息
  • Kr-store:用于存储引用消息日志数据
  • journal directory:包含了消息文件、消息日志和消息控制信息
  • Archive:归档的数据日志

4、JDBC存储

支持经过 JDBC 将消息存储到关系数据库,性能上不如文件存储,能经过关系型数据库查询到消息的信息。

MQ 支持的数据库:Apache Derby、MySQL、PostgreSQL、Oracle、SQLServer、Sybase、Informix、MaxDB。

存储表结构:

表 1:ACTIVEMQ_MSGS:用于存储消息,Queue 和 Topic 都存储在这个表中:

字段 说明
ID 自增的数据库主键
CONTAINER 消息的Destination
MSGID_PROD 消息发送者客户端的主键
MSG_SEQ 是发送消息的顺序,MSGID_PROD+MSG_SEQ能够组成JMS的MessageID
EXPIRATION 消息的过时时间,存储的是从1970-01-01到如今的毫秒数
MSG 消息本体的Java序列化对象的二进制数据
PRIORITY 优先级,从0-9,数值越大优先级越高

表 2:ACTIVEMQ_ACKS:用于存储订阅关系。若是是持久化Topic,订阅者和服务器的订阅关系在这个表保存:

字段 说明
CONTAINER 消息的Destination
SUB_DEST 若是是使用Static集群,这个字段会有集群其余系统的信息
CLIENT_ID 每一个订阅者都必须有一个惟一的客户端ID用以区分
SUB_NAME 订阅者名称
SELECTOR 选择器,能够选择只消费知足条件的消息。条件能够用自定义属性实现,可支持多属性AND和OR操做
LAST_ACKED_ID 记录消费过的消息的ID

表 3:ACTIVEMQ_LOCK(消息锁,保证同一时间只能有一个broker访问这些表结构):

表 activemq_lock 在集群环境中才有用,只有一个 Broker 能够得到消息,称为 Master Broker,其余的只能做为备份等待 Master Broker 不可用,才可能成为下一个 Master Broker。这个表用于记录哪一个 Broker 是当前的 Master Broker。

配置方式:

一、配置数据源 conf/acticvemq.xml 文件:

<!-- 配置数据源--> <bean id="mysql-ds" class="org.apache.commons.dbcp.BasicDataSource" destroy-method="close"> <property name="driverClassName" value="com.mysql.jdbc.Driver"/> <property name="url" value="jdbc:mysql://localhost:3306/activemq?relaxAutoCommit=true"/> <property name="username" value="root"/> <property name="password" value="111111"/> <property name="maxActive" value="200"/> <property name="poolPreparedStatements" value="true"/> </bean>

二、配置 broke 中的 persistenceAdapter

dataSource 指定持久化数据库的 bean,createTablesOnStartup 是否在启动的时候建立数据表,默认值是 true,这样每次启动都会去建立数据表了,通常是第一次启动的时候设置为 true,以后改为 false。

<!-- JDBC配置 --> <persistenceAdapter> <jdbcPersistenceAdapter dataSource="#mysql-ds" createTablesOnStartup="false"/> </persistenceAdapter> 

ps:数据库 activemq 须要手动建立。

5、内存消息存储

内存消息存储,会将全部的持久化消息存储在内存中,必须注意JVM使用状况以及内存限制,适用于一些能快速消费的数据量不大的小消息,当MQ关闭或者宕机,未被消费的内存消息会被清空。

配置方式 设置 broker属性值 persistent="false":

<broker xmlns="http://activemq.apache.org/schema/core" brokerName="localhost" dataDirectory="${activemq.data}" persistent="false"/>

天天用心记录一点点。内容也许不重要,但习惯很重要!