metrics-server 是一个采集集群中指标的组件,相似于 cadvisor,在 v1.8 版本中引入,官方将其做为 heapster 的替代者,metric-server 属于 core metrics(核心指标),提供 API metrics.k8s.io,仅能够查看 node、pod 当前 CPU/Memory/Storage 的资源使用状况,也支持经过 Metrics API 的形式获取,以此数据提供给 Dashboard、HPA、scheduler 等使用。node
1、开启 API Aggregation
因为 metrics-server 须要暴露 API,但 k8s 的 API 要统一管理,如何将 apiserver 的请求转发给 metrics-server ,解决方案就是使用 kube-aggregator ,因此在部署 metrics-server 以前,须要在 kube-apiserver 中开启 API Aggregation,即增长如下配置:nginx
--proxy-client-cert-file=/etc/kubernetes/certs/proxy.crt
--proxy-client-key-file=/etc/kubernetes/certs/proxy.key
--requestheader-client-ca-file=/etc/kubernetes/certs/proxy-ca.crt
--requestheader-allowed-names=aggregator
--requestheader-extra-headers-prefix=X-Remote-Extra-
--requestheader-group-headers=X-Remote-Group
--requestheader-username-headers=X-Remote-User
若是kube-proxy没有在Master上面运行,还须要配置git
--enable-aggregator-routing=true
kube-aggregator 的详细设计文档请参考:configure-aggregation-layergithub
2、部署 metrics-server
一、获取配置文件
$ git clone https://github.com/kubernetes/kubernetes
$ cd kubernetes/cluster/addons/metrics-server/
二、修改 metrics-server 配置参数
修改 resource-reader.yaml
文件:sql
rules:
- apiGroups:
- ""
resources:
- pods
- nodes
- nodes/stats #新增这一行
- namespaces
verbs:
- get
- list
- watch
修改 metrics-server-deployment.yaml
文件:shell
......
# metrics-server containers 启动参数做以下修改:
containers:
- name: metrics-server
image: k8s.gcr.io/metrics-server-amd64:v0.3.1
command:
- /metrics-server
- --metric-resolution=30s
- --kubelet-insecure-tls
- --kubelet-preferred-address-types=InternalIP,Hostname,InternalDNS,ExternalDNS,ExternalIP
# These are needed for GKE, which doesn't support secure communication yet.
# Remove these lines for non-GKE clusters, and when GKE supports token-based auth.
#- --kubelet-port=10255
#- --deprecated-kubelet-completely-insecure=true
......
# 修改启动参数:
command:
- /pod_nanny
- --config-dir=/etc/config
- --cpu=80m
- --extra-cpu=0.5m
- --memory=80Mi
- --extra-memory=8Mi
- --threshold=5
- --deployment=metrics-server-v0.3.1
- --container=metrics-server
- --poll-period=300000
- --estimator=exponential
# Specifies the smallest cluster (defined in number of nodes)
# resources will be scaled to.
#- --minClusterSize={{ metrics_server_min_cluster_size }}
三、部署
kubectl apply -f .
metrics-server 的资源占用量会随着集群中的 Pod 数量的不断增加而不断上升,所以须要 addon-resizer 垂直扩缩 metrics-server。addon-resizer 依据集群中节点的数量线性地扩展 metrics-server,以保证其可以有能力提供完整的metrics API 服务,具体参考:addon-resizer。api
所须要的镜像能够在 k8s-system-images 中下载。ruby
检查是否部署成功:bash
$ kubectl get apiservices | grep metrics
v1beta1.metrics.k8s.io kube-system/metrics-server True 2m
$ kubectl get pod -n kube-system
metrics-server-v0.3.1-65b6db6945-rpqwf 2/2 Running 0 20h
3、metrics-server 的使用
因为采集数据间隔为1分钟,等待数分钟后查看数据:微信

Metrics-server 可用 API 列表以下:
http://127.0.0.1:8001/apis/metrics.k8s.io/v1beta1/nodes
http://127.0.0.1:8001/apis/metrics.k8s.io/v1beta1/nodes/
http://127.0.0.1:8001/apis/metrics.k8s.io/v1beta1/pods
http://127.0.0.1:8001/apis/metrics.k8s.io/v1beta1/namespace/
/pods/
因为 k8s 在 v1.10 后废弃了 8080 端口,能够经过代理或者使用认证的方式访问这些 API:
$ kubectl proxy
$ curl http://127.0.0.1:8001/apis/metrics.k8s.io/v1beta1/nodes
也能够直接经过 kubectl 命令来访问这些 API,好比:
$ kubectl get --raw /apis/metrics.k8s.io/v1beta1/nodes
$ kubectl get --raw /apis/metrics.k8s.io/v1beta1/pods
$ kubectl get --raw /apis/metrics.k8s.io/v1beta1/nodes/<node-name>
$ kubectl get --raw /apis/metrics.k8s.io/v1beta1/namespace/<namespace-name>/pods/<pod-name>
本文分享自微信公众号 - 田飞雨(kubeConChina)。
若有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一块儿分享。