分布式消息队列:如何保证消息不被重复消费?(消息队列消费的幂等性)

怎么保证消息不被重复消费?(消息队列消费的幂等性)

先大概说一说可能会有哪些重复消费的问题。首先就是好比rabbitmq、rocketmq、kafka,都有可能会出现消费重复消费的问题,正常。由于这问题一般不是mq本身保证的,是给你保证的。而后咱们挑一个kafka来举个例子,说说怎么重复消费吧。redis

kafka实际上有个offset的概念,就是每一个消息写进去,都有一个offset,表明他的序号,而后consumer消费了数据以后,每隔一段时间,会把本身消费过的消息的offset提交一下,表明我已经消费过了,下次我要是重启啥的,你就让我继续从上次消费到的offset来继续消费吧。数据库

可是凡事总有意外,好比咱们以前生产常常遇到的,就是你有时候重启系统,看你怎么重启了,若是碰到点着急的,直接kill进程了,再重启。这会致使consumer有些消息处理了,可是没来得及提交offset,尴尬了。重启以后,少数消息会再次消费一次。分布式

其实重复消费不可怕,可怕的是你没考虑到重复消费以后,怎么保证幂等性。post

举个例子,假设你有个系统,消费一条往数据库里插入一条,要是你一个消息重复两次,你不就插入了两条,这数据不就错了?可是你要是消费到第二次的时候,本身判断一下已经消费过了,直接扔了,不就保留了一条数据?cdn

一条数据重复出现两次,数据库里就只有一条数据,这就保证了系统的幂等性幂等性,blog

通俗点说,就一个数据,或者一个请求,给你重复来屡次,你得确保对应的数据是不会改变的,不能出错。 rabbitmq

其实还得结合业务来思考,在这给几个思路:

  1. 好比你拿个数据要写库,你先根据主键查一下,若是这数据都有了,你就别插入了,update一下
  2. 好比你是写redis,那没问题了,反正每次都是set,自然幂等性
  3. 好比你不是上面两个场景,那作的稍微复杂一点,你须要让生产者发送每条数据的时候,里面加一个全局惟一的id,相似订单id之类的东西,而后你这里消费到了以后,先根据这个id去好比redis里查一下,以前消费过吗?若是没有消费过,你就处理,而后这个id写redis。若是消费过了,那你就别处理了,保证别重复处理相同的消息便可。

还有好比基于数据库的惟一键来保证重复数据不会重复插入多条,咱们以前线上系统就有这个问题,就是拿到数据的时候,每次重启可能会有重复,由于kafka消费者还没来得及提交offset,重复数据拿到了之后咱们插入的时候,由于有惟一键约束了,因此重复数据只会插入报错,不会致使数据库中出现脏数据队列

如何保证MQ的消费是幂等性的,须要结合具体的业务来看 进程

更多系列文章

分布式消息队列:如何保证消息队列的高可用
get

分布式消息队列:如何保证消息不被重复消费

分布式消息队列:如何保证消息的可靠性传输

最后

后续会持续更新分布式知识,你们以为不错能够点个赞在关注下,之后还会分享更多文章!

相关文章
相关标签/搜索