主要思路有两种:一、单线程消费来保证消息的顺序性;二、对消息进行编号,消费者处理时根据编号判断顺序。 面试
一、rabbitMq
问题分析:
如图,data1 和 data2 是有顺序的,必须 data1 先执行,data2 后执行;这两个数据被不一样的消费者消费到了,可能 data2 先执行,data1 后执行,这样原来的顺序就错乱了。数据库
解决方案:
如图,在 MQ 里面建立多个 queue,同一规则的数据(对惟一标识进行 hash),有顺序的放入 MQ 的 queue 里面,消费者只取一个 queue 里面获取数据消费,这样执行的顺序是有序的。或者仍是只有一个 queue 可是对应一个消费者,而后这个消费者内部用内存队列作排队,而后分发给底层不一样的 worker 来处理。多线程
二、kafka
问题分析:
如图,在 kafka 中,你对数据指定某个 key,那么这些数据会到同一个 partition 里面,在 partition 里面这些数据是有顺序的。从这里看没啥问题,插入到数据库的数据都是有序的。负载均衡
可是,咱们在消费端可能会使用多线程来处理,由于单线程的处理速度慢,为了加快处理时间和吞吐量,会使用 thread 来处理。在消费端加入线程以后,就会出现顺序不一致的状况。
如图,就是使用了多线程以后,数据顺序不一致状况。spa
在使用了多线程以后,如何来解决数据顺序问题?
如图,在消费端使用内存队列,队列里的数据使用 hash 进行分发,每一个线程对应一个队列,这样能够保证数据的顺序。线程
三、rocketMq队列
如图,生产者中把 orderId 进行取模,把相同模的数据放到 messagequeue 里面,消费者消费同一个 messagequeue,只要消费者这边有序消费,那么能够保证数据被顺序消费。内存
四、activeMq
如图,activeMq 里面有 messageGroups 属性,能够指定 JMSXGroupID,消费者会消费指定的 JMSXGroupID。即保证了顺序性,又解决负载均衡的问题。get