接上一篇《工程事故与现实世界》,继续分享一些现实中的工程事故,以及其中带来的启示。html
1979 年 3 月,美国宾夕法尼亚州三里岛核电站发生泄漏,20 英里范围内的居民所有撤离,今后之后美国放弃了核电站建设。后端
事故发生时,反应堆容器发生压力积聚,在这种状况下,正常的应对方案是打开一个安全阀门,下降压力到安全水平。这个安全阀门的设计是经过加电压到电磁制动器上使其打开,打开后会有一个监控指示灯亮起,降压后从新关上阀门,指示灯就会熄灭。缓存
操做人员在压力汇集后按正常处理流程进行了阀门打开降压操做,压力下来后,操做人员移除电压,阀门应该关闭,但实际上阀门被卡在了打开位置,而此时的监控指示灯却熄灭了,操做人员误觉得阀门已正常关闭,实际却并无关上。安全
以后,反应堆容器中的冷却剂一直泄漏了近 2 小时,直到反应堆顶部从冷却液中暴露出来,燃料棒和芯块开始融毁,在随后的仓皇失措中,轮班人员一直相信控制面板上的指示灯,认为人工减压阀处于正常的关闭状态。服务器
就是这样一个小小的报警指示灯故障,致使了此次核事故。对于像核反应堆阀门这样的关键系统部件,其工做状态须要更准确的监控报警,甚至多重监控报警进行交叉验证。好比:除了电路传感的指示灯报警,还应该有更直接的开闭位置传感报警。微信
三里岛核事故带来的启示是:对于系统中的核心关键节点,须要绝对直接并且准确的监控报警,报警自己就须要高可用,并且还能多重交叉验证。网络
20 世纪 50 年代,英国哈维兰公司开发出了第一个商用喷气式飞机,但后来该机型在同一年连续两次出现坠毁。负载均衡
后经事故调查研究找到了缘由:喷气式飞机由于比其余机型飞行高度更高,在飞机起飞和着陆时为使乘客不至于感到不适,不可避免要进行机内空气加压和减压循环;而在喷气式飞机出现以前的机型由于飞行高度低,不须要作加压和减压循环处理;当时的飞机设计人员没人想到这会有什么影响。分布式
但反复的空气加压和减压循环,致使飞机顶部天窗用以发射无线电的铆钉处金属疲劳,产生应力老化裂纹,屡次加减压循环后,裂纹扩大变成了裂缝,最终在某次飞行过程当中致使了空中解体。在飞机实验室的压力测试环境下并无真实的模仿实际的加压和减压周期,工程师对本身设计的可靠性陷入了一种错误的认识之中。测试
更可怕的是,在第一次坠机事故后,并无找到这个真正的缘由,觉得是一次意外偶然事件。在该机型停飞了两个月后,由英国首相丘吉尔和该公司总裁联合作出保证不会再出事,数周后该公司的另外一架由罗马飞往开罗的班机又坠毁于地中海后,工程师们才找到真正的缘由。
在咱们作系统时,有一些变化发生了,可能只是咱们没有注意到;还有一些变化可能并不常发生,它只在特定的异常下发生。互联网应用的不少在线系统,大部分时候流量压力是逐步积累的,但在特定的情形下也可能会发生剧烈的变化。一样一个量级的流量,是逐步达到的,仍是忽然剧烈产生的,对系统带来的压力并不同。
好比,在作 IM 系统时,有一种场景是若是出现集中网络闪断,那么全部 IM 客户端的长链接都会一块儿断开,并集中重连。这时负载均衡极有可能会让突发的集中重连流量所有打到后端第一个被轮询到的机器上,单机就会被突发的集中流量击垮。而若是是逐步提高的流量,则会均匀的被均衡到后端全部的分布式服务器上。
设计时,尽力考虑全部可能的使用场景变化,而哈维兰的教训实在太深入与悲痛了。
2006 年,波士顿的一个隧道内,有 4 块天花板,每块重 3 吨,忽然脱落掉了下来,砸中了行驶中的小车。
那么问题来了,天花板为何会忽然坍塌,而以前却毫无征兆?它们是如何固定的?天花板是由金属支架支撑,支架使用螺栓插入钻孔固定在隧道顶部,而螺栓则使用环氧树脂胶填充螺栓和孔腔之间的间隙。
环氧树脂是一种聚合物,其硬度会随时间和温度的变化而变化,若是忽然施加一个负载,环氧树脂能在短期内很好的保持原来的形状。但若是其持续承受负载(静态负载),聚合物的分子可能会慢慢移动,形成环氧树脂逐渐变形,这个过程就是 “蠕变”。
而隧道中使用的环氧树脂具备不好的抗蠕变性,负责安装的工程师忽略了这个事实,也多是对此缺少了解,所以形成了此次事故。
而程序系统中相似 “蠕变效应” 的问题有不少,好比:磁盘日志,缓存空间,内存回收,数据存储,索引周期。全部这些均可能由于足够长时间的系统运行,形成 “蠕变” 积聚,直到撑不住引起事故。
系统中没有所谓的抗 “蠕变” 组件,所以咱们须要对这些可能发生 “蠕变” 的地方进行周期性的检查,并及时处理。
...
以上就是我此次双十一前读到的一些关于现实世界更传统的工程事故,以及带给个人启示。泰坦尼克号号称当时世界上最安全的船,在撞上冰山以后,回过头来一看处处都是显而易见的问题。俄国做家费奥多·陀思妥耶夫斯基曾说过一句名言:
当失败时,彷佛一切都显得愚蠢。
现实世界的工程事故会显得更残酷,难免感慨工程师真要有敬畏之心,能修复缺陷,解决问题当然不错,但能提早去规避和发现会更好。
写点文字,画点画儿,记录成长瞬间。 微信公众号「瞬息之间」,既然碰见,不如同行。
原文出处:https://www.cnblogs.com/mindwind/p/10092918.html