kubernetes相关概念

时间 2019-12-06

标签 kubernetes 相关概念繁體版

原文原文链接

kubernetes相关概念php

kubernetes内部组件工做原理 http://dockone.io/article/5108node

从物理层面来划分的话，kubernetes分两个角色，master节点和node节点：mysql

Mastergit

Master是整个集群的控制中心，kubernetes的全部控制指令都是发给master，它负责具体的执行过程。通常咱们会把master独立于一台物理机或者一台虚拟机，它的重要性不言而喻。web

master上有这些关键的进程：sql

Kubernetes API Server（kube-apiserver)，提供了HTTP Rest接口关键服务进程，是全部资源增、删、改、查等操做的惟一入口，也是集群控制的入口进程。 #也就是说咱们想要增长或减小pod，配置一些服务（service）等等。都是要经过这个API总入口进入docker

Kubernetes Controller Manager(kube-controlker-manager)，是全部资源对象的自动化控制中心，能够理解为资源对象的大总管。数据库

Kubernetes Scheduler(kube-scheduler)，负责资源调度（pod调度）的进程，至关于公交公司的“调度室”。 #主要针对pod，好比node在一节点仍是二节点，就是由他来调度apache

etcd Server，kubernetes里全部资源对象的数据都是存储在etcd中的。 #好比rc、service（svc）、pod这些资源对象全都存到了etcd下面编程

Node

除了Master，Kubernetes集群中其余机器被称为Node，早期版本叫作Minion。Node能够是物理机也能够是虚拟机，每一个Node上会被分配一些工做负载（即，docker容器），当Node宕机后，其上面跑的应用会被转移到其余Node上。

Node上有这些关键进程：

kubelet：负责Pod对应容器的建立、启停等任务，同时与Master节点密切协做，实现集群管理的基本功能。

kube-proxy：实现Kubernetes Service的通讯与负载均衡机制的重要组件。

Docker Engine（docker）：Docker引擎，负责本机容器的建立和管理。

kubectl get nodes #查看集群中有多少个node

kubectl describe node <node name> #查看Node的详细信息

Pod

查看pod命令： kubectl get pods #s能够省略。

查看容器命令： docker ps

能够看到容器和pod是有对应关系的，在咱们作过的实验中，每一个pod对应（至少）两个容器，一个是Pause容器，一个是rc里面定义的容器（实际上，每一个pod里能够有多个应用容器）。这个Pause容器叫作“根容器”，只有当Pause容器“死亡”才会认为该pod“死亡”。Pause容器的IP以及其挂载的Volume资源会共享给该pod下的其余容器。

pod定义示例： #跟上一章的rc差很少

apiVersion: v1

kind: pod #这个地方为pod

metadata:

labels:

spec:

containers:

- name: myweb

image: kubeguide/tomcat-app:v1

ports:

- containerPort: 8080

env:

- name: MYSQL_SERVICE_HOST

value: 'mysql'

- name: MYSQL_SERVICE_PORT

value: '3306'

每一个pod均可以对其能使用的服务器上的硬件资源进行限制（CPU、内存）。CPU限定的最小单位是1/1000（千分之一）个cpu，用m表示，

如100m，就是0.1个cpu。内存限定的最小单位是字节，能够用Mi（兆）表示，如128Mi就是128M。

在kubernetes里，一个计算资源进行配额限定须要设定两个参数：

1）requests：该资源的最小申请量

2）Limits：该资源容许的最大使用量。

资源限定示例：

spec:

containers: #定义容器

- name: db

image: mysql

resources:

requests: #最小值

memory: "64Mi"

cpu: "250m"

limits: #最大值

memory: "128Mi"

cpu: "500m"

Label

Label是一个键值对（标签），其中键和值都由用户自定义，Label能够附加在各类资源对象上，如Node、Pod、Service、RC等。一个资源对象能够定义多个Label，同一个Label也能够被添加到任意数量的资源对象上。Label能够在定义对象时定义，也能够在对象建立完后动态添加或删除。

Label示例：

"release":"stable", "environment":"dev", "tier":"backend"等等。

为了实现service和pod之间的关联，又有了标签（label）的概念，咱们把功能相同的pod设定为同一个标签，好比，能够把全部提供mysql服务的pod贴上标签name＝mysql，这样mysql service要做用于全部包含name＝mysql标签的pod上。

RC是kubernetes中核心概念之一，简单说它定义了一个指望的场景，即声明某种pod的副本数量在任意时刻都符合某个预期

值，RC定义了以下几个部分：

1）pod期待的副本数 #可定义多个

2）用于筛选目标pod的Label Selector

3）建立pod副本的模板（template）

RC一旦被提交到kubernetes集群后，Master节点上的Controller Manager组件就会接收到该通知，它会按期巡检集群中存活的pod，并确保pod数量符合RC的定义值。能够说经过RC，kubernetes实现了用户应用集群的高可用性，而且大大减小了管理员在传统IT环境中不得不作的诸多手工运维工做，好比编写主机监控脚本、应用监控脚本、故障恢复处理脚本等 #也就是说rc有一个机制，能够自动的监控pod的数量是否符合预期，若是其中一个pod宕机了，能够自动的启动一个新的pod起来，这样咱们不用去监控他，一切都是自动的

RC工做流程（假如，集群中有3个Node）：

1）RC定义2个pod副本

2）假设系统会在2个Node上（Node1和Node2）建立pod

3）若是Node2上的pod（pod2）意外终止，这颇有多是由于Node2宕机

4）则会建立一个新的pod，假设会在Node3上建立pod3，固然也有可能在Node1上建立pod3

RC中动态修改pod副本数量：

kubectl scale rc <rc name> --replicas=n #n为数量

利用动态修改pod的副本数，能够实现应用的动态升级（滚动升级）：

1）以新版本的镜像定义新的RC，但pod要和旧版本保持一致（由Label决定）

2）新版本每增长1个pod，旧版本就减小一个pod，始终保持固定的值

3）最终旧版本pod数为0，所有为新版本

删除RC：

kubectl delete rc <rc name>

删除RC后，RC对应的pod也会被删除掉

Deployment

在1.2版本引入的概念，目的是为了解决pod编排问题，在内部使用了Replica Set，它和RC比较，类似度为90%以上，能够认为是RC的升级版。跟RC比较，最大的一个特色是能够知道pod部署的进度。 #后期能够逐渐的靠着Deployment去作，逐渐的把rc丢弃掉。目前仍是会有使用rc

Deployment示例：

apiVersion: extensions/v1beta1

kind: Deployment

metadata:

spec:

replicas: 1

selector:

matchLabels:

tier: frontend

matchExpressions:

- {key: tier, operator: In, values: [frontend]}

template:

metadata:

labels:

app: app-demo

tier: frontend

spec:

containers:

- name: tomcat-demo

image: tomcat

imagePullPolicy: IfNotPresent

ports:

- containerPort: 8080

kubectl create -f tomcat-deployment.yaml

kubectl get deployment

HPA(Horizontail Pod Autoscaler) #暂时没涉及到，了解

在1.1版本，kubernetes官方发布了HPA，实现pod的动态扩容、缩容，它属于一种kubernetes的资源对象。它经过追踪分析

RC控制的全部目标pod的负载变化状况，来决定是否须要针对性地调整目标Pod的副本数，这是HPA的实现原理。

pod负载度量指标：

1）CpuUtilizationPercentage

目标pod全部副本自身的cpu利用率平用均值。一个pod自身的cpu利用率＝该pod当前cpu的使用量／pod Request值。若是某

一个时刻，CPUUtilizationPercentage的值超过了80%，则断定当前的pod已经不够支撑业务，须要增长pod。

2）应用程序自定义的度量指标，好比服务每秒内的请求数（TPS或QPS）

HPA示例：

apiVerion: autosacling/v1

kind: HorizontalPodAutoscaler

metadata:

namespace: default

spec:

maxReplicas: 10

minReplicas: 1

scaleTargetRef:

kind: Deployment

targetCPUUtilizationPercentage: 90 #这定义超过多少就该扩容了

说明：HPA控制的目标对象是一个名叫php-apache的Deployment里的pod副本，当cpu平均值超过90%时就会扩容，pod副本数控制范围是1－10.

除了以上的xml文件定义HPA外，也能够用命令行的方式来定义：

kubectl autoscale deployment php-apache --cpu-percent=90 --min=1 --max=10

Service

Service是kubernetes中最核心的资源对象之一，Service能够理解成是微服务架构中的一个“微服务”，pod、RC、

Deployment都是为Service提供嫁衣的。

简单讲一个service本质上是一组pod组成的一个集群，前面咱们说过service和pod之间是经过Label来串起来的，相同Service的pod的Label同样。同一个service下的全部pod是经过kube-proxy实现负载均衡，而每一个service都会分配一个全局惟一的虚拟ip，也叫作cluster ip（kubectl get svc)。在该service整个生命周期内，cluster ip是不会改变的，而在kubernetes中还有一个dns服务，它把service的name和cluster ip映射起来。（kubectl get svc出来的name和clusterip） #上一节讲在没有使用dns的时候，只能使用ip，用了dns以后，仓可使用<name>（web-rc.ymal的配置）

service示例:(文件名tomcat-service.yaml)

apiVersion: v1

kind: Service

metadata:

spec:

ports:

- port: 8080

selector:

tier: frontend

kubectl create -f tomcat-service.yaml

kubectl get endpoints //查看pod的IP地址以及端口 #这个出来的ip，咱们基本上不去用它

kubectl get svc tomcat-service -o yaml //查看service分配的cluster ip #就是指定查看他的格式是yaml

多端口的service： #就是说这个service里面能够有多个服务（好比web服务80的，还有php的）

apiVersion: v1

kind: Service

metadata:

spec:

ports:

- port: 8080 #好比tomcat的8080

- port: 8005 #以及tomcat的8005

selector:

tier: frontend

对于cluster ip有以下限制：

1）Cluster ip没法被ping通，由于没有实体网络来响应 #可是能够telnet <ip> <port>ping同他的端口

2）Cluster ip和Service port组成了一个具体的通讯端口，单独的Cluster ip不具有TCP/IP通讯基础，它们属于一个封闭的空间。

3）在kubernetes集群中，Node ip、pod ip、cluster ip之间的通讯，采用的是kubernetes本身设计的一套编程方式的特殊路由规则。

要想直接和service通讯，须要一个Nodeport，在service的yaml文件中定义：

apiVersion: v1

kind: Service

metadata:

spec:

ports:

- port: 8080

nodeport: 31002 #大于30000

selector:

tier: frontend

它实质上是把cluster ip的port映射到了node ip的nodeport上了

Volume(存储卷)

Volume是pod中可以被多个容器访问的共享目录，kubernetes中的volume和docker中的volume不同，主要有如下几个方面：

1）kubernetes的volume定义在pod上，而后被一个pod里的多个容器挂载到具体的目录下 #同一个pod里面的容易都是能够去分享同一个volume的

2）kubernetes的volume与pod生命周期相同，但与容器的生命周期不要紧，当容器终止或者重启时，volume中的数据并不会丢失

3）kubernetes支持多种类型的volume，如glusterfs，ceph等先进的分布式文件系统

如何定义并使用volume呢？只须要在定义pod的yaml配置文件中指定volume相关配置便可：

template:

metadata:

labels:

app: app-demo

tier: frontend

spec:

volumes:

- name: datavol

emptyDir: {}

containers:

- name: tomcat-demo

image: tomcat

volumeMounts:

- mountPath: /mydata-data

imagePullPolicy: IfNotPresent

说明: volume名字是datavol，类型是emptyDir，将volume挂载到容器的/mydata-data目录下

volume的类型：

1）emptyDir

是在pod分配到node时建立的，初始内容为空，不须要关心它将会在宿主机（node）上的哪一个目录下，由于这是kubernetes自动分配的一个目录，当pod从node上移除，emptyDir上的数据也会消失。因此，这种类型的volume不适合存储永久数据，适合存放临时文件。

2）hostPath

hostPath指定宿主机（node）上的目录路径，而后pod里的容器挂载该共享目录。这样有一个问题，若是是多个node，虽然目录同样，可是数据不能作到一致，因此这个类型适合一个node的状况。

配置示例：

volumes:

- name: "persistent-storage"

hostPath:

path: "/data"

3）gcePersistentDisk #离咱们比较远

使用Google公有云GCE提供的永久磁盘（PD）存储volume数据。毫无疑问，使用gcePersistentDisk的前提是kubernetes的

node是基于GCE的。

配置示例：

volumes:

- name: test-volume

gcePersistentDisk:

pdName: my-data-disk

fsType: ext4

4）awsElasticBlockStore #离咱们比较远

与GCE相似，该类型使用亚马逊公有云提供的EBS Volume存储数据，使用它的前提是Node必须是aws EC2。

5）NFS #这个离咱们比较近，后面会有演示

使用NFS做为volume载体。

示例：

volumes:

- name: "NFS"

NFS:

server: ip地址

path: "/"

6）其余类型

iscsi

flocker

glusterfs

rbd

gitRepo: 从git仓库clone一个git项目，以供pod使用

secret: 用于为pod提供加密的信息

persistent volume（PV）

PV能够理解成kubernetes集群中某个网络存储中对应的一块存储，它与volume相似，但有以下区别：

1）PV只能是网络存储，不属于任何Node，但能够在每一个Node上访问到

2）PV并非定义在pod上，而是独立于pod以外定义

3）PV目前只有几种类型：GCE Persistent Disk、NFS、RBD、iSCSCI、AWS ElasticBlockStore、GlusterFS

以下是NFS类型的PV定义：

apiVersion: v1

kind: PersistentVolume

metadata:

spec:

capacity:

storage: 5Gi

accessModes:

- ReadWriteOnce

nfs:

path: /somepath

server: ip

其中accessModes是一个重要的属性，目前有如下类型：

ReadWriteOnce: 读写权限，而且只能被单个Node挂载

ReadOnlyMany: 只读权限，容许被多个Node挂载

ReadWriteMany：读写权限，容许被多个Node挂载 #最大权限

1.若是某个pod想申请某种条件的PV，首先须要定义一个PersistentVolumeClaim（PVC）对象：

kind: persistentVolumeClaim

apiVersion: v1

metadata:

spec:

accessModes:

- ReadWriteOnce

resources:

requests:

storage: 8Gi

2.而后在pod的vomume定义中引用上面的PVC：

volumes:

- name: mypd

persistentVolumeClaim:

ClaimName: myclaim

Namespace（命名空间）

当kubernetes集群中存在多租户的状况下，就须要有一种机制实现每一个租户的资源隔离。而namespace的目的就是为了实现资源隔离。

kubectl get namespace //查看集群全部的namespace

1.定义namespace：

apiVersion: v1

kind: Namespace

metadata:

kubectl create -f dev-namespace.yaml //建立dev namespace

2.而后再定义pod，指定namespace

apiVersion: v1

kind: Pod

metadata:

namespace: dev

spec:

containers:

- image: busybox

command:

- sleep

- "500"

查看某个namespace下的pod：

kubectl get pod --namespace=dev

etcd

etcd是用来存储kubernetes里的集群文件的（存配置文件配置的数据库）

总结：

master（控制中心）：从物理层次去划分两个角色（master和node）。他包括四个服务或进程

node（真正工做的节点）：上面有docker、pod。由kubelet来管理。kube-porxy来提供总入口访问他，实现负载均衡

pod（就是咱们的容器，上面的那一层）：pod里面有一个pose容器，提供网络和数据共享的一个容器

label（标签）：经过label把pod和service关联在一块儿

rc：用来描述或定义pod的一个场景，用rc来定义

Deployment：是rc的升级版。他的特色是能够知道pod部署的进度

HPA:是一个实现动态扩容缩容的一种资源对象

service：最终提供给用户服务的。一个cluster IP，一个name，就能够拿他去作事情了

volume：存储卷

pv：vollume之上就是pv。咱们有了pv以后，才能够把这么多的pod数据落地。好比跑一个网站，那这个网站的数据存到哪里去？数据库数据存到哪里去？最终要存到一个地方去，用pv来定义。有了pc还要建立一个pvc，pvc是要被pod引用的。pvc能够自动的去关联pv，只有pv是不行的

namespace（命名空间）：多租户的时候，须要有一个隔离的机制