k8s的HPA自动扩容与缩容

HPA介绍

Kubernetes HPA(水平Pod自动缩放)Pod水平自动伸缩,经过此功能,只需简单的配置,便可即可以利用监控指标(cpu使用率、磁盘、内存等)自动的扩容或缩容服务中Pod数量,当业务需求增长时,系统将为您无缝地自动增长适量容器,提升系统稳定性。此处将详细讲解HPA的核心设计原理和基于Hepaster的使用方法php

前提条件

系统应该可否获取到当前Pod的资源使用状况 (意思是能够执行kubectl top pod命令,而且可以获得反馈信息)。node

若要实现自动扩缩容的功能,还须要部署heapster服务,用来收集及统计资源的利用率,支持kubectl top命令,heapster服务集成在prometheus(普罗米修斯) MertricServer服务中,因此说,为了方便,我这里基于prometheus服务的环境上进行部署HPA(动态扩缩容)的服务。docker

实验环境

主机 IP地址 服务
master 192.168.1.21 k8s
node01 192.168.1.22 k8s
node02 192.168.1.23 k8s

基于[http://www.javashuo.com/article/p-armridbk-ep.html]() 的实验继续进行apache

k8s的HPA自动扩容与缩容

  • heapster:这个组件以前是集成在k8s集群的,不过在1.12版本以后被移除了。若是还想使用此功能,应该部署metricServer, 这个k8s集群资源使用状况的聚合器。
  • Cousom:一样处于beta阶段(autoscaling/v2beta1),可是涉及到自定义的REST API的开发,复杂度会大一些,而且当须要从自定义的监控中获取数据时,只能设置绝对值,没法设置使用率。

自动扩展主要分为两种:

  • 水平扩展(scale out),针对于实例数目的增减。
  • 垂直扩展(scal up),即单个实例可使用的资源的增减, 好比增长cpu和增大内存。
    HPA属于前者。它能够根据CPU使用率或应用自定义metrics自动扩展Pod数量(支持 replication controller、deployment 和 replica set)。

工做流程

  • 建立HPA资源,设定目标CPU使用率限额,以及最大/最小实例数,必定要设置Pod的资源限制参数: request,不然HPA不会工做。
  • 控制管理器每隔30s(在kube-controller-manager.service中能够经过–-horizontal-pod-autoscaler-sync-period修改)查询metrics的资源使用状况。
  • 而后与建立时设定的值和指标作对比(平均值之和/限额),求出目标调整的实例个数。
  • 目标调整的实例数不能超过第一条中设定的最大/最小实例数。若是没有超过,则扩容;超过,则扩容至最大的实例个数。
  • 重复第2-4步。

这里,咱们使用一个测试镜像, 这个镜像基于php-apache制做的docker镜像,包含了一些能够运行cpu密集计算任务的代码。负载均衡

一、建立一个deployment控制器

[root@master ~]#docker pull mirrorgooglecontainers/hpa-example:latest
//下载hpa-example镜像

[root@master ~]# kubectl run php-apache --image=mirrorgooglecontainers/hpa-example --requests=cpu=200m --expose  --port=80
//基于hpa-example镜像,运行一个deployment控制器,请求CPU的资源为200m,暴露一个80端口

查看一下

[root@master ~]# kubectl get deployments.

k8s的HPA自动扩容与缩容

二、建立HPA控制器

[root@master ~]# kubectl autoscale deployment php-apache --cpu-percent=50 --min=1 --max=10
//当deployment资源对象的CPU使用率达到50%时,就进行扩容,最多能够扩容到10个

查看一下

[root@master ~]# kubectl get hpa

k8s的HPA自动扩容与缩容

三、测试(master开启三个端口)

新开启多个终端,对pod进行死循环请求php-apache的podide

端口一

(1)建立一个应用,用来不停的访问咱们刚刚建立的php-apache的svc资源。

[root@master ~]# kubectl run -i --tty load-generator --image=busybox /bin/sh

(2)进入Pod内,执行如下这条命令.用来模拟访问php-apache的svc资源。

[root@master ~]# while true; do wget -q -O- http://php-apache.default.svc.cluster.local ; done
//不停地向php-apache的svc资源,发送ok

端口二

[root@master ~]# kubectl get hpa -w
//实时查看pod的cpu状态

k8s的HPA自动扩容与缩容

能够看到php-apache的cpu使用状况已经超过了50%测试

端口三

[root@master images]# kubectl get pod -w
//实时查看pod的状态

k8s的HPA自动扩容与缩容
至此,pod副本数量的自动扩缩容就实现了。google

能够看到当php-apache的cpu使用状况超过50%后,就会不断生成新的php-apache来进行负载均衡(目前设置的上线时10个),固然,若是cpu使用状况降低到50%,master就会陆续地删除php-apache,这样的使用能够减小没必要要的资源浪费、资源分配不均等状况。设计

相关文章
相关标签/搜索