k8s的HPA自动扩容与缩容

时间 2020-03-01

标签 k8s hpa 自动扩容繁體版

原文原文链接

HPA介绍

Kubernetes HPA（水平Pod自动缩放）Pod水平自动伸缩，经过此功能，只需简单的配置，便可即可以利用监控指标（cpu使用率、磁盘、内存等）自动的扩容或缩容服务中Pod数量，当业务需求增长时，系统将为您无缝地自动增长适量容器，提升系统稳定性。此处将详细讲解HPA的核心设计原理和基于Hepaster的使用方法。php

前提条件

系统应该可否获取到当前Pod的资源使用状况 (意思是能够执行kubectl top pod命令,而且可以获得反馈信息)。node

若要实现自动扩缩容的功能，还须要部署heapster服务，用来收集及统计资源的利用率，支持kubectl top命令，heapster服务集成在prometheus（普罗米修斯） MertricServer服务中，因此说，为了方便，我这里基于prometheus服务的环境上进行部署HPA（动态扩缩容）的服务。docker

实验环境

主机	IP地址	服务
master	192.168.1.21	k8s
node01	192.168.1.22	k8s
node02	192.168.1.23	k8s

基于[http://www.javashuo.com/article/p-armridbk-ep.html]() 的实验继续进行apache

heapster：这个组件以前是集成在k8s集群的,不过在1.12版本以后被移除了。若是还想使用此功能，应该部署metricServer, 这个k8s集群资源使用状况的聚合器。
Cousom：一样处于beta阶段(autoscaling/v2beta1)，可是涉及到自定义的REST API的开发，复杂度会大一些，而且当须要从自定义的监控中获取数据时，只能设置绝对值，没法设置使用率。

自动扩展主要分为两种：

水平扩展(scale out)，针对于实例数目的增减。
垂直扩展(scal up)，即单个实例可使用的资源的增减, 好比增长cpu和增大内存。
HPA属于前者。它能够根据CPU使用率或应用自定义metrics自动扩展Pod数量(支持 replication controller、deployment 和 replica set)。

工做流程

建立HPA资源，设定目标CPU使用率限额，以及最大/最小实例数，必定要设置Pod的资源限制参数: request，不然HPA不会工做。
控制管理器每隔30s(在kube-controller-manager.service中能够经过–-horizontal-pod-autoscaler-sync-period修改)查询metrics的资源使用状况。
而后与建立时设定的值和指标作对比(平均值之和/限额)，求出目标调整的实例个数。
目标调整的实例数不能超过第一条中设定的最大/最小实例数。若是没有超过，则扩容；超过，则扩容至最大的实例个数。
重复第2-4步。

这里，咱们使用一个测试镜像，这个镜像基于php-apache制做的docker镜像，包含了一些能够运行cpu密集计算任务的代码。负载均衡

一、建立一个deployment控制器

[root@master ~]#docker pull mirrorgooglecontainers/hpa-example:latest
//下载hpa-example镜像

[root@master ~]# kubectl run php-apache --image=mirrorgooglecontainers/hpa-example --requests=cpu=200m --expose  --port=80
//基于hpa-example镜像，运行一个deployment控制器，请求CPU的资源为200m，暴露一个80端口

查看一下

[root@master ~]# kubectl get deployments.

二、建立HPA控制器

[root@master ~]# kubectl autoscale deployment php-apache --cpu-percent=50 --min=1 --max=10
//当deployment资源对象的CPU使用率达到50%时，就进行扩容，最多能够扩容到10个

查看一下

[root@master ~]# kubectl get hpa

三、测试（master开启三个端口）

新开启多个终端，对pod进行死循环请求php-apache的podide

端口一

（1）建立一个应用，用来不停的访问咱们刚刚建立的php-apache的svc资源。

[root@master ~]# kubectl run -i --tty load-generator --image=busybox /bin/sh

（2）进入Pod内，执行如下这条命令.用来模拟访问php-apache的svc资源。

[root@master ~]# while true; do wget -q -O- http://php-apache.default.svc.cluster.local ; done
//不停地向php-apache的svc资源，发送ok

端口二

[root@master ~]# kubectl get hpa -w
//实时查看pod的cpu状态

能够看到php-apache的cpu使用状况已经超过了50%测试

端口三

[root@master images]# kubectl get pod -w
//实时查看pod的状态

至此，pod副本数量的自动扩缩容就实现了。google

能够看到当php-apache的cpu使用状况超过50%后，就会不断生成新的php-apache来进行负载均衡（目前设置的上线时10个），固然，若是cpu使用状况降低到50%，master就会陆续地删除php-apache，这样的使用能够减小没必要要的资源浪费、资源分配不均等状况。设计