关于OOM故障复盘

故障背景     在业务高峰时期,出现io告警和内存告警,应用程序挂掉,从而导致业务中断。     业务中断如何定义?对于现在的应用来说,都是高可用的,那么意味着挂了一个其实没什么关系,就像人员的主备,好像暂时还没出现人员的双活情况,双活可能导致的问题就是心跳不同步,信息不到位,从而导致脑裂。     业务中断的定义:请求的成功数量/总的请求的数量,从而定义一个服务水平。或许服务水平也可以这样来定
相关文章
相关标签/搜索