HPA的全称为Horizontal Pod Autoscaling,它能够根据当前pod资源的使用率(如CPU、磁盘、内存等),进行副本数的动态的扩容与缩容,以便减轻各个pod的压力。当pod负载达到必定的阈值后,会根据扩缩容的策略生成更多新的pod来分担压力,当pod的使用比较空闲时,在稳定空闲一段时间后,还会自动减小pod的副本数量。php
若要实现自动扩缩容的功能,还须要部署heapster服务,用来收集及统计资源的利用率,支持kubectl top命令,heapster服务集成在prometheus(普罗米修斯) MertricServer服务中,因此说,为了方便,我这里基于prometheus服务的环境上进行部署HPA(动态扩缩容)的服务。node
能够参考博文:K8s的监控之三种可视化UI界面部署的第三个部署Prometheus服务,来运行prometheus服务!!!apache
说这么多,总之就是想要使用HPA,就必须保证,能够在master节点上执行以下命令:markdown
[root@master ~]# kubectl top node #查看节点的资源使用状况 NAME CPU(cores) CPU% MEMORY(bytes) MEMORY% master 1317m 65% 1383Mi 80% node01 1237m 61% 1082Mi 62% node02 1146m 57% 1045Mi 60%
1)生成HPA控制器并发
[root@master ~]# kubectl run php-apache --image=mirrorgooglecontainers/hpa-example --requests=cpu=200m --expose --port=80 //运行hpa资源,名称为php-apache,并设置请求CPU的资源为200m并暴露一个80端口 [root@master ~]# kubectl autoscale deployment php-apache --cpu-percent=50 --min=1 --max=10 //当hpa资源的deployment资源对象的CPU使用率达到50%时,就进行扩容,最多能够扩容到10个 [root@master ~]# kubectl get svc | grep php-apache //查看php-apache对应的svc群集IP php-apache ClusterIP 10.97.45.108 <none> 80/TCP 44m [root@master ~]# kubectl get pod | grep php-apa //肯定当前的pod正常运行 php-apache-867f97c8cb-9mpd6 1/1 Running 0 44m
2)模拟消耗php-apache的资源,并验证pod是否会自动扩容与缩容ide
新开启多个终端(也可以使用node节点),对php-apache的pod进行死循环请求,以下(若是你的系统资源比较充足,能够选择开启多个终端,对pod进行死循环请求,我这里开启了两个node的终端,同时请求php-apache的pod):google
[root@node01 ~]# while true; do wget -q -O- 10.97.45.108; done //一直返回ok属于正常现象 //模拟多用户对php-apache的pod形成的并发请求
[root@master ~]# kubectl get hpa //查看hpa资源对cpu的占用状况 #也可以使用“-w”选项对CPU资源占用状况实时监控 NAME REFERENCE TARGETS MINPODS MAXPODS REPLICAS AGE php-apache Deployment/php-apache 416%/50% 1 10 10 56m [root@master ~]# kubectl get pod //在运行死循环请求一段时间后,查看pod数量,固然使用-w选项对pod的变化进行实时的监控 NAME READY STATUS RESTARTS AGE php-apache-867f97c8cb-6jsjq 1/1 Running 0 4m9s php-apache-867f97c8cb-7xd5x 1/1 Running 0 51s php-apache-867f97c8cb-9mpd6 1/1 Running 0 56m php-apache-867f97c8cb-dhng7 1/1 Running 0 3m8s php-apache-867f97c8cb-qc9hr 1/1 Running 0 2m22s php-apache-867f97c8cb-rj494 1/1 Running 0 3m38s php-apache-867f97c8cb-sbn9n 1/1 Running 0 3m38s php-apache-867f97c8cb-vzfbg 1/1 Running 0 4m9s php-apache-867f97c8cb-vzfbg 1/1 Running 0 5m19s php-apache-867f97c8cb-vzfbg 1/1 Running 0 3m39s //固然最大也就只能够产生10个pod,由于咱们以前规定最多产生10个pod
当中止死循环请求后,也并不会当即减小pod数量,会等一段时间后减小pod数量,防止流量再次激增。code
至此,HPA实现pod副本数量的自动扩容与缩容就实现了。对象