【Java进阶面试系列之五】消息中间件集群崩溃，如何保证百万生产数据不丢失？【石杉的架构笔记】

时间 2019-11-05

标签 Java进阶面试系列之五消息中间件集群崩溃如何保证百万生产数据丢失石杉的架构笔记栏目负载均衡繁體版

原文原文链接

欢迎关注我的公众号：石杉的架构笔记（ID:shishan100）
面试

周一至周五早8点半！精品技术文章准时送上！算法

“上一篇讲消息中间件的文章《扎心！线上服务宕机时，如何保证数据100%不丢失？》，初步给你们介绍了一个在生产环境中可能遇到的问题，就是你的消费者服务可能会宕机，一旦宕机，你就须要考虑是否会致使没处理完的消息丢失。这篇文章，再给不太熟悉MQ技术的同窗，介绍另一个生产环境中可能会遇到的问题。

目前为止，你的RabbitMQ部署在线上服务器了，对吧？而后订单服务和仓储服务均可以基于RabbitMQ来收发消息，同时仓储服务宕机，不会致使消息丢失。性能优化

好，咱们来看下目前为止的架构图。bash

那若是此时出现一个问题，就是说订单服务投递了订单消息到RabbitMQ里去，RabbitMQ暂时放在了本身的内存中，还没来得及投递给下游的仓储服务呢，此时RabbitMQ忽然宕机了，会怎么样？服务器

答案其实很简单，默认状况下，按照咱们目前的代码和配置，这个数据就会丢失了。架构

因此在这里而言，就牵扯到了RabbitMQ的一个较为重要的概念：消息的持久化，用英文来讲就是durable机制。并发

而后这里又有一个引伸的概念，若是按照咱们以前的代码和配置，默认状况下，RabbitMQ一旦宕机就再次重启，就会丢失咱们以前建立的queue。因此首先得先让queue是持久化的。分布式

使用下面的代码，就能够把咱们的“warehouse_schedule_delivery”这个queue，也就是仓储调度发货的queue，设置为持久化的。微服务

这样，即便RabbitMQ宕机后重启，也会恢复以前建立好的这个queue。高并发

channel.queueDeclare(
       "warehouse_schedule_delivery",
        true, 
        false,
        false,
        null);
复制代码

你们看到上面那行定义和建立queue的代码么？核心在于第二个参数，第二个参数是true。

他的意思就是说，这个建立的queue是durable的，也就是支持持久化的。

RabbitMQ会把这queue的相关信息持久化的存储到磁盘上去，这样RabbitMQ重启后，就能够恢复持久化的queue。

OK，如今你的queue的信息能够持久化了，RabbitMQ宕机重启后会自动恢复queue。可是，你的queue里的message数据呢？

queue里都是订单服务发送过去的订单消息数据，若是RabbitMQ还没来得及投递queue里的订单消息到仓储服务，结果RabbitMQ就宕机了。

那此时RabbitMQ重启以后，他能够恢复queue的信息，可是queue的message数据是无法恢复了。

因此此时还有一个重要的点，就是在你的订单服务发送消息到RabbitMQ的时候，须要定义这条消息也是durable，即持久化的。

channel.basicPublish(
 "", 
 "warehouse_schedule_delivery",
 MessageProperties.PERSISTENT_TEXT_PLAIN,
 message.getBytes());

复制代码

经过上面的方式来发送消息，就可让发送出去的消息是持久化的。

一旦标记了消息是持久化以后，就会让RabbitMQ把消息持久化写入到磁盘上去，此时若是RabbitMQ还没投递数据到仓储服务，结果就忽然宕机了。那么再次重启的时候，就会把磁盘上持久化的消息给加载出来。

整个过程，以下图所示：

可是这里要注意一点，RabbitMQ的消息持久化，是不承诺100%的消息不丢失的。

由于有可能RabbitMQ接收到了消息，可是还没来得及持久化到磁盘，他本身就宕机了，这个时候消息仍是会丢失的。

若是要彻底100%保证写入RabbitMQ的数据必须落地磁盘，不会丢失，须要依靠其余的机制。

下次有机会再继续给不太熟悉MQ技术的同窗，来说解这里的东西。

END

若有收获，请帮忙转发，您的鼓励是做者最大的动力，谢谢！

一大波微服务、分布式、高并发、高可用的原创系列文章正在路上

欢迎扫描下方二维码，持续关注：

石杉的架构笔记（id:shishan100）

十余年BAT架构经验倾囊相授

推荐阅读：
一、拜托！面试请不要再问我Spring Cloud底层原理

二、【双11狂欢的背后】微服务注册中心如何承载大型系统的千万级访问？

三、【性能优化之道】每秒上万并发下的Spring Cloud参数优化实战

四、微服务架构如何保障双11狂欢下的99.99%高可用

五、兄弟，用大白话告诉你小白都能听懂的Hadoop架构原理

六、大规模集群下Hadoop NameNode如何承载每秒上千次的高并发访问

七、【性能优化的秘密】Hadoop如何将TB级大文件的上传性能优化上百倍

八、拜托，面试请不要再问我TCC分布式事务的实现原理坑爹呀！

九、【坑爹呀！】最终一致性分布式事务如何保障实际生产中99.99%高可用？

十、拜托，面试请不要再问我Redis分布式锁的实现原理！

十一、【眼前一亮！】看Hadoop底层算法如何优雅的将大规模集群性能提高10倍以上？

十二、亿级流量系统架构之如何支撑百亿级数据的存储与计算

1三、亿级流量系统架构之如何设计高容错分布式计算系统

1四、亿级流量系统架构之如何设计承载百亿流量的高性能架构

1五、亿级流量系统架构之如何设计每秒十万查询的高并发架构

1六、亿级流量系统架构之如何设计全链路99.99%高可用架构

1七、七张图完全讲清楚ZooKeeper分布式锁的实现原理

1八、大白话聊聊Java并发面试问题之volatile究竟是什么？

1九、大白话聊聊Java并发面试问题之Java 8如何优化CAS性能？

20、大白话聊聊Java并发面试问题之谈谈你对AQS的理解？

2一、大白话聊聊Java并发面试问题之公平锁与非公平锁是啥？

2二、大白话聊聊Java并发面试问题之微服务注册中心的读写锁优化

2三、互联网公司的面试官是如何360°无死角考察候选人的？（上篇）

2四、互联网公司面试官是如何360°无死角考察候选人的？（下篇）

2五、Java进阶面试系列之一：哥们，大家的系统架构中为何要引入消息中间件？

2六、【Java进阶面试系列之二】：哥们，那你说说系统架构引入消息中间件有什么缺点？

2七、【行走的Offer收割机】记一位朋友斩获BAT技术专家Offer的面试经历

2八、【Java进阶面试系列之三】哥们，消息中间件在大家项目里是如何落地的？

2九、【Java进阶面试系列之四】扎心！线上服务宕机时，如何保证数据100%不丢失？

30、一次JVM FullGC的背后，竟隐藏着惊心动魄的线上生产事故！

3一、【高并发优化实践】10倍请求压力来袭，你的系统会被击垮吗？

做者：石杉的架构笔记连接：https://juejin.im/post/5c1c8f5a6fb9a049fe351f36 来源：掘金著做权归做者全部。商业转载请联系做者得到受权，非商业转载请注明出处。