从“控制器”模型，谈容器编排

时间 2019-11-07

标签控制器模型容器编排繁體版

原文原文链接

若是你对容器稍有涉猎，应该知道：Pod这个看似复杂的API对象，实际上就是对容器的进一步抽象和封装而已。node

说得更形象些，“容器”镜像虽然好用，可是容器这样一个“沙盒”的概念，对于描述应用来讲，仍是太过简单了。这就比如，集装箱当然好用，可是若是它四面都光秃秃的，吊车还怎么把这个集装箱吊起来并摆放好呢？nginx

因此，Pod对象，其实就是容器的升级版。它对容器进行了组合，添加了更多的属性和字段。这就比如给集装箱四面安装了吊环，使得Kubernetes这架“吊车”，能够更轻松地操做它。编程

而Kubernetes操做这些“集装箱”的逻辑，都由控制器（Controller）完成。在专栏的第12篇文章《牛刀小试：个人第一个容器化应用》中，咱们曾经使用过Deployment这个最基本的控制器对象。api

如今，咱们一块儿来回顾一下这个名叫nginx-deployment的例子：bash

apiVersion: apps/v1
kind: Deployment
metadata:
  name: nginx-deployment
spec:
  selector:
    matchLabels:
      app: nginx
  replicas: 2
  template:
    metadata:
      labels:
        app: nginx
    spec:
      containers:
      - name: nginx
        image: nginx:1.7.9
        ports:
        - containerPort: 80复制代码

这个Deployment定义的编排动做很是简单，即：请确保携带了app=nginx标签的Pod的个数，永远等于spec.replicas指定的个数，即2个。网络

这就意味着，若是在这个集群中，携带app=nginx标签的Pod的个数大于2的时候，就会有旧的Pod被删除；反之，就会有新的Pod被建立。架构

这时，你也许就会好奇：到底是Kubernetes项目中的哪一个组件，在执行这些操做呢？app

在Kubernetes架构中，有一个叫做kube-controller-manager的组件。oop

实际上，这个组件，就是一系列控制器的集合。咱们能够查看一下Kubernetes项目的pkg/controller目录：ui

$ cd kubernetes/pkg/controller/
$ ls -d */              
deployment/             job/                    podautoscaler/          
cloud/                  disruption/             namespace/              
replicaset/             serviceaccount/         volume/
cronjob/                garbagecollector/       nodelifecycle/          replication/            statefulset/            daemon/
...复制代码

这个目录下面的每个控制器，都以独有的方式负责某种编排功能。而咱们的Deployment，正是这些控制器中的一种。

实际上，这些控制器之因此被统一放在pkg/controller目录下，就是由于它们都遵循Kubernetes项目中的一个通用编排模式，即：控制循环（control loop）。

好比，如今有一种待编排的对象X，它有一个对应的控制器。那么，我就能够用一段Go语言风格的伪代码，为你描述这个控制循环：

for {
  实际状态 := 获取集群中对象X的实际状态（Actual State）
  指望状态 := 获取集群中对象X的指望状态（Desired State）
  if 实际状态 == 指望状态{
    什么都不作
  } else {
    执行编排动做，将实际状态调整为指望状态
  }
}复制代码

在具体实现中，实际状态每每来自于Kubernetes集群自己。

好比，kubelet经过心跳汇报的容器状态和节点状态，或者监控系统中保存的应用监控数据，或者控制器主动收集的它本身感兴趣的信息，这些都是常见的实际状态的来源。

而指望状态，通常来自于用户提交的YAML文件。

好比，Deployment对象中Replicas字段的值。很明显，这些信息每每都保存在Etcd中。

接下来，以Deployment为例，我和你简单描述一下它对控制器模型的实现：

Deployment控制器从Etcd中获取到全部携带了“app: nginx”标签的Pod，而后统计它们的数量，这就是实际状态；
Deployment对象的Replicas字段的值就是指望状态；
Deployment控制器将两个状态作比较，而后根据比较结果，肯定是建立Pod，仍是删除已有的Pod（具体如何操做Pod对象，我会在下一篇文章详细介绍）。

能够看到，一个Kubernetes对象的主要编排逻辑，其实是在第三步的“对比”阶段完成的。

这个操做，一般被叫做调谐（Reconcile）。这个调谐的过程，则被称做“Reconcile Loop”（调谐循环）或者“Sync Loop”（同步循环）。

因此，若是你之后在文档或者社区中碰到这些词，都不要担忧，它们其实指的都是同一个东西：控制循环。

而调谐的最终结果，每每都是对被控制对象的某种写操做。

好比，增长Pod，删除已有的Pod，或者更新Pod的某个字段。这也是Kubernetes项目“面向API对象编程”的一个直观体现。

其实，像Deployment这种控制器的设计原理，就是咱们前面提到过的，“用一种对象管理另外一种对象”的“艺术”。

其中，这个控制器对象自己，负责定义被管理对象的指望状态。好比，Deployment里的replicas=2这个字段。

而被控制对象的定义，则来自于一个“模板”。好比，Deployment里的template字段。

能够看到，Deployment这个template字段里的内容，跟一个标准的Pod对象的API定义，丝绝不差。而全部被这个Deployment管理的Pod实例，其实都是根据这个template字段的内容建立出来的。

像Deployment定义的template字段，在Kubernetes项目中有一个专有的名字，叫做PodTemplate（Pod模板）。

这个概念很是重要，由于后面我要讲解到的大多数控制器，都会使用PodTemplate来统必定义它所要管理的Pod。更有意思的是，咱们还会看到其余类型的对象模板，好比Volume的模板。

至此，咱们就能够对Deployment以及其余相似的控制器，作一个简单总结了：

如上图所示，相似Deployment这样的一个控制器，实际上都是由上半部分的控制器定义（包括指望状态），加上下半部分的被控制对象的模板组成的。

这就是为何，在全部API对象的Metadata里，都有一个字段叫做ownerReference，用于保存当前这个API对象的拥有者（Owner）的信息。

那么，对于咱们这个nginx-deployment来讲，它建立出来的Pod的ownerReference就是nginx-deployment吗？或者说，nginx-deployment所直接控制的，就是Pod对象么？

这个问题的答案，我会在「深刻剖析Kubernetes」专栏第33讲深刻解析容器跨主机网络中进行详细解释。

文章相关：

完整文章：极客时间「深刻剖析Kubernetes」第32讲 | 浅谈容器网络

拓展阅读：

深刻解析容器跨主机网络

解读Kubernetes三层网络方案