什么是 DaemonSet?
DaemonSet 确保所有(或者一些)Node 上运行一个 Pod 的副本。当有 Node 加入集群时,也会为他们新增一个 Pod 。当有 Node 从集群移除时,这些 Pod 也会被回收。删除 DaemonSet 将会删除它建立的全部 Pod。node
使用 DaemonSet 的一些典型用法:docker
- 运行集群存储 daemon,例如在每一个 Node 上运行
glusterd
、ceph
。
- 日志收集,好比fluentd,logstash等
- 系统监控,好比Prometheus Node Exporter,collectd,New Relic agent,Ganglia gmond等
- 系统程序,好比kube-proxy, kube-dns, glusterd, ceph等
一个简单的用法是,在全部的 Node 上都存在一个 DaemonSet,将被做为每种类型的 daemon 使用。 一个稍微复杂的用法多是,对单独的每种类型的 daemon 使用多个 DaemonSet,但具备不一样的标志,和/或对不一样硬件类型具备不一样的内存、CPU要求。api
例子
使用Fluentd收集日志的例子:app
-
- apiVersion: extensions/v1beta1 kind: DaemonSet metadata: name: fluentd spec: template: metadata: labels: app: logging id: fluentd name: fluentd spec: containers: - name: fluentd-es image: gcr.io/google_containers/fluentd-elasticsearch:1.3 env: - name: FLUENTD_ARGS value: -qq volumeMounts: - name: containers mountPath: /var/lib/docker/containers - name: varlog mountPath: /varlog volumes: - hostPath: path: /var/lib/docker/containers name: containers - hostPath: path: /var/log name: varlog
选择运行节点:当指定.spec.template.spec.nodeSelector,DaemonSet将会在匹配的节点上建立pod。若是都没有指定,DaemonSet在全部node节点上建立pod.dom
指定Node节点
DaemonSet会忽略Node的unschedulable状态,有两种方式来指定Pod只运行在指定的Node节点上:elasticsearch
- nodeSelector:只调度到匹配指定label的Node上
- nodeAffinity:功能更丰富的Node选择器,好比支持集合操做
- podAffinity:调度到知足条件的Pod所在的Node上
nodeSelector示例
首先给Node打上标签ui
kubectl label nodes node-01 disktype=ssd
而后在daemonset中指定nodeSelector为disktype=ssd:google
spec:
nodeSelector:
disktype: ssd
nodeAffinity示例
nodeAffinity目前支持两种:requiredDuringSchedulingIgnoredDuringExecution和preferredDuringSchedulingIgnoredDuringExecution,分别表明必须知足条件和优选条件。好比下面的例子表明调度到包含标签kubernetes.io/e2e-az-name而且值为e2e-az1或e2e-az2的Node上,而且优选还带有标签another-node-label-key=another-node-label-value的Node。spa
-
- apiVersion: v1 kind: Pod metadata: name: with-node-affinity spec: affinity: nodeAffinity: requiredDuringSchedulingIgnoredDuringExecution: nodeSelectorTerms: - matchExpressions: - key: kubernetes.io/e2e-az-name operator: In values: - e2e-az1 - e2e-az2 preferredDuringSchedulingIgnoredDuringExecution: - weight: 1 preference: matchExpressions: - key: another-node-label-key operator: In values: - another-node-label-value containers: - name: with-node-affinity image: gcr.io/google_containers/pause:2.0
podAffinity示例
podAffinity基于Pod的标签来选择Node,仅调度到知足条件Pod所在的Node上,支持podAffinity和podAntiAffinity。这个功能比较绕,如下面的例子为例:.net
- 若是一个“Node所在Zone中包含至少一个带有security=S1标签且运行中的Pod”,那么能够调度到该Node
- 不调度到“包含至少一个带有security=S2标签且运行中Pod”的Node上
-
apiVersion: v1 kind: Pod metadata: name: with-pod-affinity spec: affinity: podAffinity: requiredDuringSchedulingIgnoredDuringExecution: - labelSelector: matchExpressions: - key: security operator: In values: - S1 topologyKey: failure-domain.beta.kubernetes.io/zone podAntiAffinity: preferredDuringSchedulingIgnoredDuringExecution: - weight: 100 podAffinityTerm: labelSelector: matchExpressions: - key: security operator: In values: - S2 topologyKey: kubernetes.io/hostname containers: - name: with-pod-affinity image: gcr.io/google_containers/pause:2.0
静态Pod
除了DaemonSet,还可使用静态Pod来在每台机器上运行指定的Pod,这须要kubelet在启动的时候指定manifest目录:
kubelet --pod-manifest-path=/etc/kubernetes/manifests
而后将所须要的Pod定义文件放到指定的manifest目录中。
注意:静态Pod不能经过API Server来删除,但能够经过删除manifest文件来自动删除对应的Pod。