一文让你了解Kubernetes架构

时间 2019-11-06

原文原文链接

本篇文章咱们将会探讨Kubernetes的总体架构。node

Kubernetes起源自Google内部系统Borg，它是容器应用集群部署和管理的系统。Kubernetes核心功能是为了减轻物理机或者虚拟机集群编排、网络以及存储等的管理负担，使开发者只须要关注应用的业务逻辑。经过Kubernetes开发者能够自定义工做流甚至自动化的任务流。git

Kubernetes拥有全面的集群管理能力，主要包括：多级的受权机制、多租户应用、透明的服务注册和发现机制、内置的负载均衡、错误发现和自修复能力、服务升级回滚和自动扩容等。Kubernetes拥有完善的管理工具，主要包括：部署、部署测试、集群的运行和资源状态的监控等。github

什么是Borg

Borg是Google内部大规模集群管理系统，主要工做是对Google内部服务的调度和管理。Borg的主要目标是将开发者从硬件资源管理中解放出来，将精力集中在业务逻辑上、最大化多数据中心的资源利用。docker

以下如所示：Borg系统主要由如下组件构成：BorgMaster、BorgLet、Borgcfg和Scheduler。数据库

BorgMaster 整个集群的大脑：负责管理集群的状态、保证集群存储的数据具备高度容错性
Scheduler 负责任务的调度工做：按照应用的特色将它们调度到适当的机器上
BorgLet 负责任务的运行工做
Borgcfg 是Borg系统的命令行交互工具，事实上是经过配置文件向集群系统提交任务

Kubernetes 架构

Kubernetes中的Pod、Service、Label以及一个Pod一个IP地址等的设计依托于Borg，所以总体上看，Kubernetes与Borg的架构很是类似。服务器

Kubernetes中提供灵活和松耦合的机制用于服务发现，像大多数分布式集群平台，Kubernetes集群中至少包含一个主节点和多个工做节点。网络

主节点负责暴露应用程序的API、调度deployments和管理整个集群。每一个工做节点都运行着容器运行时，（如Docker或者rkt）经过代理与主节点通讯。架构

工做节点同时运行着其它组件，如：日志、监控、服务发现和其它可选组件。工做节点是Kubernetes集群中真正运行应用的地方。工做节点能够是云服务商提供的虚拟机或者是运行着的服务器。负载均衡

Pod是一个或多个容器的集合并扮演着Kuberntes集群中最核心的管理单元，Pod同时也充当着容器共享的上下文和资源的逻辑边界。Pod的分组机制弥补了容器化与虚拟化的差别从而实如今Pod中执行多个子进程。在运行时，Pod能够经过建立replica sets实现集群的扩容，同时Replica set保证集群内须要的Pod数量与真正运行的Pod数量的一致。框架

Replica sets声明须要挂起Pod的数量和监控预约的Pod中有效的数量。单个Pod或者Replica Set能够经过Service向内部或外部用户暴露服务，Service经过筛选知足条件的Pod实现服务发现。Pod经过定义键值对的Label，Service经过Seletor筛选合法的Pod。任何新Pod打上知足Seletor筛选器的Label后将会自动被Service服务发现。这种设计架构提供了灵活、松耦合的服务发现机制。

Kubernetes中的资源对象（如：Pods、Replica setsje和Service）提交到master节点后，Master节点根据Pod的需求和资源的可用性将Pod调度到适当的工做节点上。工做节点从镜像仓库中拉取镜像，而后在本地运行时环境中拉起容器。

etcd是CoreOS开源的、分布式、键值对数据库，它是集群全部组件单一数据源（SSOT）的保障。Master节点查询etcd获取工做节点、Pods和容器状态的各类参数。

Kubernetes主要由如下组件构成：

Apiserver是操做资源的入口而且提供认证、受权、权限控制、API注册和服务发现的机制
Controller Manager负责管理集群的状态，如异常发现、自动扩容和滚动更新等
Scheduler负责资源的调度以及根据预先设定的调度策略将pod调度到合适的节点上
Kubelet负责管理容器的生命周期、数据卷以及网络（CNI）
容器运行时负责镜像的管理
Kube-proxy负责服务发现和集群Service的负载均衡

除了以上核心内容，接下来咱们将讨论

编排须要使用简单、功能复杂的容器架构
简要概述容器编排和Kubernetes
容器化环境下的网络

编排层

在容器化的架构中，编排层须要实现对容器的部署、扩容和管理。

将容器调度到物理或者虚拟机上，有时还须要维护千级别的容器主机
在容器宕机的时候从新拉起
设置容器网络
对容器进行扩容以及创建和解除资源间的关系
服务发现

开发者能够经过购买业界云服务商提供的IaaP和IaaS服务实现容器编排。根据业务分布式容器管理架构的需求，开发者能够在云服务商那里选择具有适当编排难度的服务。

简单编排架构

你知道简单的node.js架构吗？若是你的程序只须要或者与下面类似的架构（不多的进程、一个或者两个数据库、一个负载均衡器、一个客户端和一个宿主机），docker内置的[编排工具就能够知足你的需求。

若是你的技术架构比上图复杂不少，我以为Amazon ECS或者Kubenrnets更适合你的需求，接下来咱们在谈谈K8s。

Kubernetes组件

依托于Kubernets主从的设计架构，系统能够提供高效、水平扩容的分布式系统。网络特性促进大量组件间的高效通讯。

下面是Kubernetes中的核心组件：

Pod：Kubernets中最小的管理和部署单位，一个Pod中能够有一个或多个容器。同一Pod中的容器共享IP地址、经过localhost相互通讯、共享数据卷
Node：Kubernetes中工做节点，可使物理机或者虚拟机、为Pods提供运行资源
Service：一组逻辑Pods和它们访问策略的抽象，为一组相同属性的Pods抽象出一个固定IP地址，容许Pod之间以及Pod与Service之间相互通讯
ReplicaSet：保证集群在任什么时候间点上都有指定数量的Pod副本，除非你须要定制滚动更新的策略或者不须要滚动更新，K8s推荐使用Deployment而不是直接操做ReplicaSet
Deployment：提供Pods滚动更新和ReplicaSets的控制器
Namespace：将集群资源

下图经过虚拟的边界描述Kubernetes组件各自的做用范围：

标签和筛选器

Kubernetes为区分用户和资源提供许多特性：

Labels: 附在资源对象（如Pod）的键值对，可使如发布期限、环境和堆栈等具备辨识度的元数据
Selector：Kubernetes中的核心分组原语，标签筛选器能够经过标签分组管理资源对象

Labels、Selector和namespces在Kubernetes中实现灵活动态的配置能力发挥着相当重要的做用。须要明确一点相同namespace下的两个控制器的标签筛选器不能重合，否则会引起冲突。

Kubernetes的设计是以分布式框架的基础，它在构建和管理其它微服务以及分布式框架等方便表现的很是出色。深刻探讨Kubernetes提供服务的详细信息不在本书探讨的范围内，下图是展现Kubernete上各组件间相互做用的更高级视图。

当咱们研究Kubernetes如何处理容器网路时请记住上图的中的信息流。

容器网络

容器间的网络问题是容器编排中最严苛的挑战之一，在这一部分咱们将会探讨Docker处理容器连通的网络策略，这种策略是如何限制容器编排的规模以及Kubernetes是如何在上实现容器网络连通的基础上实现快速优雅的扩容。

Docker处理容器间网络

默认状况下Docker容器使用host-private网络。为了实现容器间网络连通，Docker所在的宿主机提供默认名为docker0的虚拟网桥，宿主机并会为网桥上的容器预留足够的空间。容器和网桥是如何链接的？Docker为每一个容器分配一个虚拟网络设备（veth），经过网络地址转换（NAT）将虚拟网桥的地址与容器的地址映射到一块儿。NAT方法是经过修改网络包的IP头信息将一个IP地址映射为其它的IP地址。

这种方案对自动化运维的挑战

首先这种经过网桥实现容器网络的连通须要容器在同一台宿主机或连接在相同的网桥上。这对于容器网络量有限，限制集群数量的状况下是能够知足的，可是对多宿主机的集群就会形成网络故障。另外彻底依靠NAT实现网络的连通也会形成性能故障。

Kubernetes处理容器间网络

Kubernetes的网络方案比Docker默认的网络方案更加高效且更易扩容。为了实现这个目的，Kubernetes的网络实现必须知足如下需求。

全部容器在不使用NAT时能够与其余容器通讯
全部子节点能够在不使用NAT时能够与其它容器通讯
全部容器本身看到的IP地址与其它节点或者容器看到的IP地址是同样的

当知足这些条件后，在多个团队和开发人员之间协调移植变得更加容易。诸如Flannel、WeaveNet、Calico均可以实现Kubernetes容器网路的连通。

文章翻译自Kubernetes architecture Quick Introduction，行文时略有删减