如何利用termination GracePeriodSeconds 优雅地关闭你的服务


当涉及到分布式系统,处理故障是关键。Kubernetes经过利用能够监视系统状态并从新启动已中止执行的服务的控制器(controllers)来解决这个问题。另外一方面,Kubernetes一般能够强制终止您的应用程序,做为系统正常运行的一部分。html

在容器出现以前,大多数应用运行在虚拟机或者物理机上。若是应用程序崩溃,启动替换程序须要很长时间。若是您只有一台或两台机器来运行应用程序,那么这种恢复时间是不可接受的。nginx

相反,在崩溃时使用进程级监控来从新启动应用程序变得很常见。若是应用程序崩溃,监视进程能够捕获退出代码并当即从新启动应用程序。数据库

随着像Kubernetes这样的系统的出现,再也不须要进程监控系统,由于Kubernetes能够处理重启崩溃的应用程序。Kubernetes使用事件循环来确保容器和节点等资源是健康的。这意味着您再也不须要手动运行这些监视进程。 
若是资源未经过健康检查,Kubernetes会自动启动一个替代品。api

Kubernetes终止生命周期

Kubernetes不只能够监控崩溃应用程序,它还能够建立更多应用程序副本,以便在多台计算机上运行,更新应用程序,甚至能够同时运行多个版本的应用程序!微信

这意味着Kubernetes能够终止一个彻底健康的容器有不少缘由。若是您使用滚动更新更新部署,Kubernetes会在启动新pod时慢慢终止旧pod。若是drain一个节点,Kubernetes将终止该节点上的全部pod。若是节点资源不足,Kubernetes将终止pod以释放这些资源网络

您的应用程序要优雅地处理终止是相当重要的,能够最终用户受到的影响最小,而且恢复时间尽量快!架构

实际上,这意味着您的应用程序须要处理SIGTERM消息并在收到它时开始关闭。 
这意味着保存全部须要保存的数据,关闭网络链接,完成剩下的任何工做以及其余相似任务。并发

一旦Kubernetes决定终止您的Pod,就会发生一系列事件。 
让咱们看看Kubernetes终止生命周期的每一步。负载均衡

1 - K8S 启动新POD。

此时,新的POD等待启动分布式

2 - K8S等待新POD进入Ready(Running) 状态。

此时,pod状态为Running。

3 - K8S建立Endpoint。

此时,k8s建立endpoint,将新服务归入负载均衡。

4 - Pod设置为”Terminating”状态,并从全部服务的Endpoints列表中删除。

此时,Pod中止得到新的流量。但在Pod中运行的容器不会受到影响。

5 - preStop Hook被执行

preStop Hook是一个发送到Pod中的容器特殊命令或Http请求。

若是您的应用程序在接收SIGTERM时没有正常关闭,您可使用preStop Hook来触发正常关闭。 
接收SIGTERM时大多数程序都会正常关闭,但若是您使用的是第三方代码或管理的系统没法控制,则preStop Hook是在不修改应用程序的状况下触发正常关闭的好方法。

6 - SIGTERM信号被发送到Pod

此时,Kubernetes将向pod中的容器发送SIGTERM信号。这个信号让容器知道它们很快就会关闭。

您的代码应该监听此事件并在此时开始干净利落关闭。这可能包括中止任何长期链接(如数据库链接或WebSocket流),保存当前状态或其它相似的事情。

即便您使用preStop Hook,若是您发送SIGTERM信号,测试应用程序会发生什么状况也很重要,以确保您对生产环境并不感到惊讶!

7 - Kubernetes等待优雅的终止

此时,Kubernetes等待指定的时间称为优雅终止宽限期。默认状况下,这是30秒。值得注意的是,这与preStop Hook和SIGTERM信号并行发生。Kubernetes不会等待preStop Hook完成。

若是你的应用程序完成关闭并在terminationGracePeriod完成以前退出,Kubernetes会当即进入下一步。

若是您的Pod一般须要超过30秒才能关闭,请确保增长优雅终止宽限期。您能够经过在Pod YAML中设置terminationGracePeriodSeconds选项来实现。 
例如,要将其更改成60秒:

apiVersion: v1kind: Podmetadata: name: nginx namespace: defaultspec: containers: - name: nginx image: nginx terminationGracePeriodSeconds: 30

8 - SIGKILL信号被发送到Pod,并删除Pod

若是容器在优雅终止宽限期后仍在运行,则会发送SIGKILL信号并强制删除。与此同时,全部的Kubernetes对象也会被清除。

结论

Kubernetes能够出于各类缘由终止pod,并确保您的应用程序优雅地处理这些终止,这是建立稳定系统和提供出色用户体验的核心。

译者注:

kubernetes文档指出,有些步骤是同时执行的。所以有可能会致使该Pod仍然列在服务的Endpoints中并仍然接收流量,而它已经收到SIGTERM而且已经中止,所以负载均衡器上可能会有一些Http 504。目前解决这个问题可使用preStop Hook 在容器收到SIGTERM时sleep一段时间,以确终止期间的流量能够正确处理。设置方式:

apiVersion: v1kind: Podmetadata: name: nginx namespace: defaultspec: containers: - name: nginx image: nginx lifecycle:  preStop:  exec:  command:  - sleep - 30 terminationGracePeriodSeconds: 60

特别说明: 
preStop Hook并不会影响SIGTERM的处理,所以有可能preStopHook尚未执行完就收到SIGKILL致使容器强制退出。所以若是preStop Hook设置了n秒,须要设置terminationGracePeriodSeconds为terminationGracePeriodSeconds+n秒。

文章来源:https://blog.8mi.net/Kubernetes/88.html

推荐阅读:

谈谈 Kubernetes 架构

什么是高并发架构?

到底什么是分布式系统?

Kubernetes是什么以及你为何选择它?


点击【 在看 】,谢谢。

本文分享自微信公众号 - kubernetes中文社区(kubernetes_cn)。
若有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一块儿分享。

相关文章
相关标签/搜索