zabbix告警信息网络
当前状态:PROBLEM:2020-11-28T00:15:41.833920+08:00 0 [ERROR] [MY-011496] [Repl] Plugin group_replication reported: 'This server is not able to reach a majority of members in the group. This server will now block all updates. The server will remain blocked for the next 5 seconds. Unless contact with the majority is restored, after this time the member will error out and leave the group. It is possible to use group_replication_force_members to force a new group membership.'less
关于MGR集群有几点须要注意的地方,不然可能会生产事故的:
一、备份不要在MGR集群上进行备份,在灾备库上备份
二、大数据抽取数据不要在MGR集群上,也要在灾备库上抽取ide
关于告警咱们能够简单分析一下,三节点MGR集群,一个节点没法和多数节点通讯,致使的结果会阻塞全部更新。这个阻塞前会有5秒的保留时间,是根据一个 组复制参数group_replication_member_expel_timeout,默认值5s,固然这个时间要看本身使用的MySQL版本决定。大数据
分析思路:
一、查看时间点的系统资源使用状况,内存、CPU、网络流量、磁盘使用率等
二、发现磁盘使用率异常、磁盘IO异常,大量的写入操做
三、MGR其余节点无大量写入,分析多是临时文件致使
四、查看慢查询日志,是否有排序、分组类操做,致使生产大量临时文件等this
结论:
大数据抽数致使的磁盘IO耗尽,系统无响应,MGR集群没法通讯,无响应节点被驱除出集群,这个锅DBA不能背啊~rest