ZK节点数过大导致不可用,引发ResourceManager挂掉

ZK节点数过大导致不可用,引发ResourceManager挂掉 故障经过 故障经过 晚上8点多突然发现flink任务大面积挂掉重启的告警,然后打开 yarn-ui进行查看发现 ui也挂了 根据情况以及日志,初步判定RM挂了,然后查看RM 日志,发现ZK连不上,怀疑ZK有问题, 然后又登录ZK集群,查看ZK日志 ##ZK日志 为了尽快恢复故障,减少故障时间,决定重启RM,但是启动失败,感觉RM启动
相关文章
相关标签/搜索