Kubernetes理论基础

时间 2019-12-06

标签 kubernetes 理论基础繁體版

原文原文链接

Kubernetes理论基础

Kubernetes定义

kubernetes是Google开源的容器集群管理系统，2014年6月开源。在Docker技术之上，为容器应用提供资源调度、部署运行、服务发现、扩容缩容、等功能，能够看作是基于容器的micro-pass平台，pass的表明性项目。html

Kubernetes特性

强大的容器编排能力
轻量级
开放开源

Kubernetes核心概念

1. Pod

Pod是若干容器的组合，一个Pod内的容器都必须运行在同一台宿主机上，这些容器使用相同的命名空间，IP地址和端口，能够经过localhost互相发现和通讯。能够共享一块存储卷空间。是Kubernetes中最小的管理单位。经过Pod更高层次的抽象，提供了更加灵活的管理方式。

2. Service

Service是应用服务的抽象，定义了Pod的逻辑上的集合和访问Pod集合的策略。Service将代理Pod对外表现为一个单一的访问接口，外部不须要了解Pod如何运行，这给扩展和维护带来不少好处，提供了一套简化的服务代理和发现机制

例如：node

apiVersion: v1
kind: Service
metadata:
 name: tomcat-service
spec:
     ports:
    - port: 8080
    selector:
      tier: fronted

上面定义一个名为 "tomcat-service" 的Service，服务端口为8080，全部拥有"fronted"的这个Label的全部Pod实例都属于这个Service。即全部 tomcat-service的流量都会被转发到这些Podnginx

3. Replication Controller（RC）

顾名思义"RC"用来控制作复制控制，确保用户定义的Pod副本数保持不变。RC是弹性伸缩、滚动升级的核心。git

例如：github

apiVersion: v1
kind: ReplicationContorller
metadata:
 name: nginx
spec:
 replicas: 3
 selector:
   app: nginx
 template:
   metadata:
     name: nginx
     labels:
       app: ningx
   spec:
     containers:
       - name: nginx
       - images: nginx
       ports:
        - containerPort: 80

上面展现了建立三个nginx的Pod，Kubernetes中Controller Manger会尽可能将拥有"app: nginx"标签的三个Pod会分布不一样的Node上，保证集群中老是会有符合RC定义的数量的Pod。当任意一个Pod、或者所属的Node出现问题，Controller Manager会自动建立新的Pod。docker

能够经过控制RC来控制Pod的副本数量，来达到动态缩放的目的:api

kebectl scale rc nginx --replicas=1

RS 和 RC 什么关系？tomcat

4. Replica Sets (RS)

ReplicaSet（RS）是 RC 的升级版，它们的区别是对选择器的支持。RS支持 labels user guide中描述的set-based选择器要求，而 RC 仅仅支持qeuality-based的选择器要求。(看一眼超连接内容、或者下文Label的内容)bash

RS 虽然能够单独使用，可是仍是被Deployments用做Pod的建立、删除、更新。使用Deployment时，没必要关心RS。能够经过Deployment管理RS。服务器

RS 和 RC都是确保运行指定数量的Pod。Deployment 是一个更高层次的概念，能够管理RS，而且提供对Pod更新等功能，建议使用Deployment来管理RS。

RS 对我是隐藏的？直接使用Deployment来管理?

5. Deployment

Deployment是为了更好的解决Pod的编排问题，在内部使用RS（RC升级版）来实现目的。在Deployment中描述目标状态，Deployment Controller就会自动实现Deploymen中描述的目标状态，并指导当前Pod的进度状态。（部署是否完成）

Deployment建立的对象不能手动进行管理！

例如：

apiVersion: apps/v1
kind: Deployment
metadata:
  name: nginx-deployment
  labels:
    app: nginx
spec:
  replicas: 3
  selector:
    matchLabels:
      app: nginx
  template:
    metadata:
      labels:
        app: nginx
    spec:
      containers:
      - name: nginx
        image: nginx:1.7.9
        ports:
        - containerPort: 80

能够看到上面并无RS/RC的配置。可是Deployment会自动使用RS的方式建立Pod和Pod副本。

6. Label

Label就是一对 key/value，能够被关联到对象（Node、Pod、Service、RS），一个对象能够关联任意数量的Label，同一个Label也能够被关联到任务数量的对象上。一般在定义对象时肯定，也能够建立对象后动态添加删除。

能够经过对象的Label来实现多维度的资源分组管理，能够方便的进行资源分配、调度、配置、部署等管理工做。经常使用的Label以下：

* 版本标签release: stable、canary
* 环境标签env: dev、production
* 架构标签tier: frontend、backend、middleware
* 分区标签partition: customerA、customerB
* 质量管控标签track: daily、weekly  Master

Selector能够理解为SQL查询语句中的where条件，在定义定义Service、RC/RS、Deployment时，指定相应的Label就会和自动对应的Pod对象。

7. Horizontal Pod Autoscaler（HPA）

上面说到能够经过命令（kebectl scale）手动调节Pod的数量上限扩容缩容，显然这不够自动化。从Kubernetes1.1版本开始，HPA功能被当作重量级特性推出。与RC、Deployment同样，都属于Kubernetes的一种资源对象，经过追踪分析RC控制的全部目标Pod的负载状况针对性的调整目标Pod的副本数量（实现原理？）。

Pod负载度量指标:

* CPUutilizationPercentage
    这是一个算数平均值，即全部Pod的自身CPU利用率的平均值。
* 应用自定义指标（TPS/QPS)

8. Master

Master是Kubernetes集群中的控制节点，通常会独自占据一个服务器，Master节点上有如下关键组件：

Kubernetes API server (kube-apiserver), http rest接口的关键进程，是全部操做指令的惟一入口。
Kubernetes Controller Manager(kube-controller-manager), 全部资源对象的自动化控制中心。
Kubernetes Scheduler (kkube-scheduler,负责资源(Pod)的调度。Pod的"调度室"

9. Node

Node能够理解为Kubernetes集群中的计算节点/工做节点，当某个Node宕机时，这个Node节点上的负载会自动转移到其余节点上去。Node节点上有一下关键组件：

kubelet: Pod 对应的容器建立、启停、等
kube-proxy: 实现 Service的通讯与负载均衡机制的重要组件
docker: e，就是docker

10. Namespace

当团队或者项目中有多个用户时，可使用Namepace来区分，namespace是一种将集群资源划分多个用途的方法。主要用于实现多租户的资源隔离，经过Namespace将集群内部资源对象分配到不一样的Namespace中。造成逻辑上的分组，Kubernetes集群启动后会自动建立一个"default"的namespace。

11. Volume

Volume（存储卷）能够被理解为Pod中的共享目录，volume被定义在Pod上，Pod内的容器能够访问挂载。volume与Pod的生命周期相同，与具体的docker 容器生命周期不相关，某个docker容器删除或中止时，Volume中的数据不回丢失，volume支持不少种类型文件系统，GFS/Ceph/NFS。

在Kubernetes中volume有几种类型：

1. emptyDir: 无需指定对应宿主机上的目录文件、无需永久保留的临时目录，跟随Pod的移除而被移除。
2. hostPath: 为Pod挂载宿主机上的文件或目录，使用宿主机的文件系统存储，这样的方式Kubernetes没法对宿主机上的资源归入管理（好比资源配额），各个Node节点上的目录文件不一样而致使Valume的访问结果不一致。
3. gcePersistentDisk: Google共有云提供的永久磁盘。
4. awsElasticBloukStore: AWS提供的 EBS Volume存储。
5. NFS: 网络文件存储系统
6. iscsi: iscsi 存储设备
7. flocker: Flocker ?? 
8. glusterfs: 开源的ClusterFS网络文件存储系统
9. rbd: Linux 块设备共存存储
10. gitRepo: 从GIT 库cone一个git repository 给Pod用
11. secret: Kubernetes中一种保存机密信息的volume，Pod经过挂载的方式获取帐号密码信息

Kubernetes的服务发现机制

Kubernetes中的每一个Service都有一个惟一的Cluster IP 和惟一的名字，名字是开发者本身定义，部署的时候也不会改变，能够固定在配置中，因此这个问题就是：用Service 名字找到对应Cluster IP。

老的解决方案中须要设置一大堆环境变量，每一个Service建立时就会生成对应的环境变量，而后Service中的每一个Pod启动时就会加载这些变量。在后来的版本中引入了DNS系统，把服务名做为DNS域名，这样程序就能够直接使用服务名来创建通讯。

外部系统访问Service的问题

Kubernetes集群中有三种IP：

Node IP：Node 计算节点的IP
Pod IP：Pod 的IP地址
Cluster IP: Service 的IP地址

解释

Node IP 是集群中每一个物理节点的IP地址，是真实存在于物理网络中的。
Pod IP 是每一个Pod的IP地址，是docker 根据docker0 网桥的IP地址段进行分配的，是衣蛾虚拟的二层网络。Kubernetes集群中要求位于不一样Node上的Pod可以直接通讯，因此一个Pod内的容器和另外一个Pod内的容器通讯就是经过Pod IP 所在的虚拟二层网络完成的。而实际的TCP/IP流量测试经过Node IP所在屋里网卡流出的。
Cluster IP 属于Service，也是一个虚拟的IP地址。仅仅做用于Kubernetes Service 这个对象、没法ping、只能和Service Port组成一个具体的通讯端口。Kubernetes集群外部没法直接使用个IP，而当服务必须被外部访问时，能够采用NodePort 的方法。

例如:
```
apiVersion: v1
kind: Service
metadata:
  name: nginx-service
spec:
  type: NodePort
  ports:
   - port: 8080
   nodePort: 31002
  selector:
    tier: frontend
```
咱们访问http://Node:31002 便可
NodePort 衍生的负载均衡问题

NodePort的方式在每一个Node节点上开放了端口，想让用户的请求转发到这些Node上的端口，就须要一个负载均衡器。负载均衡器能够在Kubernetes集群内部，仍是也能够在集群外部？

在集群外部，好比GCE公有云，只要把Service的type=NodePort改成type=LoadBalancer，Kubernetes就会自动建立一个对应的Load balancer，并返回他的IP地址供外部客户端使用。其余云看支不支持了。
最后，能够经过 NodePort、LB、Ingress（还没研究）这三个方式?
- Ingress阿里云的文档

参考：

http://www.k8smeetup.com/article/E1eohwDEzm

国内开源的K8s相关平台：

domeos官网、文档、github