阿里Java面试题剖析：在高并发的状况下如何保证消息的顺序性？

时间 2019-11-16

原文原文链接

面试原题

如何保证消息的顺序性？mysql

面试官心理分析

其实这个也是用 MQ 的时候必问的话题，第一看看你了不了解顺序这个事儿？第二看看你有没有办法保证消息是有顺序的？这是生产系统中常见的问题。面试

面试题剖析

我举个例子，咱们之前作过一个 mysql binlog 同步的系统，压力仍是很是大的，日同步数据要达到上亿，就是说数据从一个 mysql 库原封不动地同步到另外一个 mysql 库里面去（mysql -> mysql）。常见的一点在于说好比大数据 team，就须要同步一个 mysql 库过来，对公司的业务系统的数据作各类复杂的操做。sql

你在 mysql 里增删改一条数据，对应出来了增删改 3 条 binlog 日志，接着这三条 binlog 发送到 MQ 里面，再消费出来依次执行，起码得保证人家是按照顺序来的吧？否则原本是：增长、修改、删除；你楞是换了顺序给执行成删除、修改、增长，不全错了么。数据库

原本这个数据同步过来，应该最后这个数据被删除了；结果你搞错了这个顺序，最后这个数据保留下来了，数据同步就出错了。架构

先看看顺序会错乱的俩场景：并发

RabbitMQ：一个 queue，多个 consumer。好比，生产者向 RabbitMQ 里发送了三条数据，顺序依次是 data1/data2/data3，压入的是 RabbitMQ 的一个内存队列。有三个消费者分别从 MQ 中消费这三条数据中的一条，结果消费者2先执行完操做，把 data2 存入数据库，而后是 data1/data3。这不明显乱了。

Kafka：好比说咱们建了一个 topic，有三个 partition。生产者在写的时候，其实能够指定一个 key，好比说咱们指定了某个订单 id 做为 key，那么这个订单相关的数据，必定会被分发到同一个 partition 中去，并且这个 partition 中的数据必定是有顺序的。
消费者从 partition 中取出来数据的时候，也必定是有顺序的。到这里，顺序仍是 ok 的，没有错乱。接着，咱们在消费者里可能会搞多个线程来并发处理消息。由于若是消费者是单线程消费处理，而处理比较耗时的话，好比处理一条消息耗时几十 ms，那么 1 秒钟只能处理几十条消息，这吞吐量过低了。而多个线程并发跑的话，顺序可能就乱掉了。

解决方案

RabbitMQ

拆分多个 queue，每一个 queue 一个 consumer，就是多一些 queue 而已，确实是麻烦点；或者就一个 queue 可是对应一个 consumer，而后这个 consumer 内部用内存队列作排队，而后分发给底层不一样的 worker 来处理。

Kafka

一个 topic，一个 partition，一个 consumer，内部单线程消费，单线程吞吐量过低，通常不会用这个。
写 N 个内存 queue，具备相同 key 的数据都到同一个内存 queue；而后对于 N 个线程，每一个线程分别消费一个内存 queue 便可，这样就能保证顺序性。

以为不错请点赞支持，欢迎留言或进个人我的群855801563领取【架构资料专题目合集90期】、【BATJTMD大厂JAVA面试真题1000+】，本群专用于学习交流技术、分享面试机会，拒绝广告，我也会在群内不按期答题、探讨。学习