云计算之路-阿里云上-容器服务:移除节点引起博问站点短暂故障

昨天 18:00 以后咱们将自建 docker swarm 集群上的全部应用都切换到了阿里云 swarm 容器服务(非 swarm mode ,不支持 overlay 网络)的集群上。web

今天晚上咱们经过阿里云容器服务控制台将1个节点移出集群(当时集群中一共有9个节点)docker

没想到这样一个常规操做居然形成了博问站点故障网络

故障时间 20:53-20:55 左右,由此给您带来麻烦,请您谅解。阿里云

发现故障时,咱们经过阿里云容器服务控制台“从新部署”博问应用后恢复正常。3d

故障相关日志以下:日志

2018-3-22 20:53:28
伸缩服务q_web失败:Conflict: The name q_web_1 is already assigned. You have to delete (or rename) that container to be able to assign q_web_1 to a container again.
2018-3-22 20:53:28
伸缩服务q_web失败:Conflict: The name q_web_2 is already assigned. You have to delete (or rename) that container to be able to assign q_web_2 to a container again.

另外,咱们又发现重启集群中的1个节点也会造跑在这个节点上的全部应用故障,而不像咱们自建 docker swarm 集群那样会自动将容器迁移到其余节点。并且,节点重启后应用不能自动恢复,须要手工一个一个“从新部署”应用。code

相关文章
相关标签/搜索