看完本文但愿读者可以了解到,Docker 的基本原理,Kubernetes 是怎么工做的, 对于前端 Kubernetes 有哪些优点与玩法。html
Docker 和传统部署方式最大的不一样在于,它将不会限制咱们使用任何工具,任何语言,任何版本的 runtime,Docker 将咱们的应用当作一个只提供网络服务的盒子(也即容器),Kubernetes 则是对这些盒子进行更多自动化的操做,自动建立,自动重启,自动扩容,自动调度,这个过程称之为容器编排。前端
在今天,容器编排技术给 Web 应用带来了巨大的灵活性,让咱们轻松建立须要的程序对外提供服务。和传统的 IaaS 相比,不须要去关心云主机申请,云主机配置等信息,也不需考虑云主机故障致使的服务不可用,由 Kubernetes 的副本控制器帮咱们完成云主机故障发生后容器迁移。node
本篇文章和你们一块儿,回顾一下从 Docker 到 Kubernetes 的一些相关内容,最后再看看 Kubernetes 在前端领域有哪些优点和新玩法。linux
Linux Debian/Ubuntu, 安装 社区版DockerCEnginx
Windows 一键安装git
若是是 Windows10, Windows7 将会使用 VirtualBox 安装 Linux 做为 Docker 的宿主机。 Windows10 Pro 会使用 Hyper-V 安装 Linux 做为 Docker 的宿主机。github
默认 Docker 存储位置为 /var/lib/docker
,全部的镜像,容器,卷都会在这里,若是你使用了多硬盘,或者挂载了 SSD 不在 /
上,须要修改默认路径(graph)到合适位置,配置文件为 /etc/docker/daemon.json
, 例如web
{ "bip": "192.168.0.1/16", "graph": "/mnt/ssd/0/docker" } 复制代码
Docker 在安装过程当中会自动建立好 docker0 网卡,并分配 ip 给他。 上面指定的 bip 是指定了 docker0 网卡的 ip , 若是不指定那么在建立 docker0 时会自动根据主机 ip 选取一个合适的 ip,不过因为网络的复杂性,特别是机房网络内很容易发现地址选取冲突,这时候就须要手动指定 bip 为一个合适的值。docker 的 ip 选取规则这篇文章分析的很好, 能够参考 blog.csdn.net/longxing_12… 。docker
安装并启动后能够经过 docker info
查看Docker的一些配置信息。shell
Docker 检查安装是否正常的第一个测试命令很简单。
docker run hello-world
复制代码
首先他会去 Docker Hub 上下载 hello-world 这个镜像,而后在本地运行这个镜像,启动后的这个 Docker 服务称之为容器。容器建立后就会执行规定的入口程序,程序执行向流中输出了一些信息后退出,容器也会随着这个入口程序的结束而结束。
docker ps -a
复制代码
输出以下:
cf9a6bc212f9 hello-world "/hello" 28 hours ago Exited (0) 3 min
复制代码
第一列为容器 id, 不少针对容器的操做都须要这个 id, 例以下面一些经常使用的操做。
docker rm container_id
docker stop container_id
docker start container_id
docker describe container_id
复制代码
这里有个docker start container_id
, 启动一个容器,说明容器即便退出后其资源依然存在,还可使用docker start
重启这个容器。要想让容器退出后自动删除能够在docker run
时指定--rm
参数。
当咱们运行这个命令时 Docker 会去下载 hello-world 这个镜像缓存到本地,这样当下次再运行这条命令时就不须要去源中下载。
docker images
复制代码
Nginx 做为使用普遍的 Web 服务器在 Docker 世界里也是一样流行, 经常用来启动一个网络服务验证网络配置状况, 使用下面这条命令启动 Nginx 容器 docker run --rm -p 80:80 nginx
。
访问 localhost:80
端口便可看到 Nginx 服务启动, 控制台中能够看到 Nginx 服务的日志输出。
由于 Docker 内的网络与外部世界是隔离的,因此咱们须要手动指定端口转发 -p 80:80
来显式将宿主机的80(前)转发到容器的80端口, 暴露端口是咱们提供服务最经常使用的使用方式之一。 也有一些其余类型的服务,例如日志处理,数据收集须要共享数据卷才能提供服务,全部这些都须要咱们在启动容器时显式指定。
一些常见的启动参数:
-p
本机端口:容器端口 映射本地端口到容器-P
将容器端口映射为本机随机端口-v
本地路径或卷名:容器路径 将本地路径或者数据卷挂载到容器的指定位置-it
做为交互式命令启动-d
将容器放在后台运行--rm
容器退出后清除资源Docker 的底层核心原理是利用了 Linux 内核的 namespace 以及 cgroup 特性,其中 namespace 进行资源隔离,cgroup 进行资源配额, 其中 Linux 内核中一共有 6 种 namespace,分别对应以下。
Namespace | 系统调用函数 | 隔离内容 |
---|---|---|
UTS | CLONE_NEWUTS | 主机与域名 |
IPC | CLONE_NEWIPC | 信号量、消息队列和共享内存 |
PID | CLONE_NEWPID | 进程编号 |
Network | CLONE_NEWNET | 网络设备、网络栈、端口等 |
Mount | CLONE_NEWNS | 挂载点(文件系统) |
User | CLONE_NEWUSER | 用户和用户组 |
在系统调用中有三个与namespace有关的函数:
若是我想让子进程拥有独立的网络地址,TCP/IP 协议栈,能够下面这样指定。
clone(cb, *stack , CLONE_NEWNET, 0) 复制代码
将当前进程转移到新的 namespace 中, 例如使用 fork 或 vfork 建立的进程将默认共享父级资源,使用 unshare 将子进程从父级取消共享。
给指定的PID指定 namespace, 一般用于共享 namespace。
Linux 在内核层支持了在系统调用中隔离 namespace, 经过给一个进程分配单独的 namespace 从而让其在各个资源维度进行隔离,每一个进程都能获取到本身的主机名,IPC, PID, IP, 根文件系统,用户组等信息,就像在一个独占系统中,不过虽然资源进行了隔离,可是内核仍是共享同一个,这也是比传统虚拟机轻量的缘由之一。
另外只有资源进行隔离还不够,要想保证真正的故障隔离,互不影响, 还须要对针对 CPU, 内存,GPU 等进行限制,由于若是一个程序出现死循环或者内存泄露也会致使别的程序没法运行。 资源配额是使用内核的 cgroup 特性来完成,想了解细节的同窗能够参考: www.cnblogs.com/sammyliu/p/… 。 (另外强烈推荐在 Linux 4.9 以上的内核跑容器,Linux 3.x 中有已知内核不稳定致使主机重启的问题)
一个容器要想提供服务,就须要将自身的网络暴露出去。Docker 是与宿主机上的环境是隔离的,要想暴露服务就须要显示告诉 Docker 哪些端口容许外部访问,在运行 docker run -p 80:80 nginx
时这里就是将容器内部的 80 端口暴露到宿主机的 80 端口上,具体的端口转发下面会具体分析一下。容器的网络部分是容器中最重要的部分,也是构建大型集群的基石,在咱们部署 Docker 的应用时,须要要对网络有个基本的了解。
Docker 提供了四种网络模式,分别为 Host
, Container
, None
, Bridge
使用 --net
进行指定
docker run --net host nginx
复制代码
Host 模式不会单独为容器建立 network namespace, 容器内部直接使用宿主机网卡,此时容器内获取 ip 为宿主机 ip,端口绑定直接绑在宿主机网卡上,优势是网络传输时不用通过 NAT 转换,效率更高速度更快。
docker run --net container:xxx_containerid nginx
复制代码
和指定的 container 共享 network namespace, 共享网络配置,ip 地址和端口,其中没法共享网络模式为 Host 的容器。
docker run --net none busybox ifconfig
复制代码
指定为 None 模式的容器内将不会分配网卡设备,仅有内部 lo
网络。
docekr run --net bridge busybox ifconfig
复制代码
该模式为默认模式,容器启动时会被分配一个单独的 network namespace,同时 Docker 在安装/初始化时会在宿主机上建立一个名为 docker0 的网桥,该网桥也做为容器的默认网关,容器网络会在该网关网段内进行 ip 的分配。
当我执行 docker run -p 3000:80 nginx
时,Docker 会在宿主机上建立下面一条 iptable 转发规则。
最底下的规则显示当外部请求主机网卡 3000 端口时将它进行目的地址转换(DNAT), 目的地址修改成 172.18.0.2
,端口修改成 80,修改好目的地址后流量会从本机默认网卡通过 docker0 转发到对应的容器,这样当外部请求宿主机的 3000 端口,内部会将流量转发给内部容器服务,从而实现服务的暴露。
一样 Docker 内部访问外部接口也会进行源地址转换(SNAT), 容器内部请求 google.com
, 服务器上收到的将是主机网卡的 ip。
Bridge 模式因为多了一层 NAT 转换因此效率会比 Host 模式差一些,可是可以很好的隔离外部网络环境,让容器独享 ip 且具备完整的端口空间。
上面四种网络模式是 Docker 自带的几种工做方式,可是部署 Kubernetes 须要全部的容器都工做在一个局域网中,因此在部署集群时须要多主机网络插件的支持。
多主机网络解决方案有 CNCF 推出的 CNI 规范以及 Docker 自带的 CNM 方案,可是目前你们用的最多的仍是 CNI 规范,其中一种实现就是 Flannel。
Flannel 使用了报文嵌套技术来解决多主机网络互通问题,将原始报文进行封包,指定包ip为目的主机地址,等包到达主机后再进行拆包传送到对应的容器。下图显示 flannel 使用效率更高的 UDP 协议来在主机间传输报文。
目前主流跨主机通讯目前经常使用的有三种,各有优缺,视场景选择:
overlay
, 即上面的报文嵌套。hostgw
经过修改主机路由表实现转发,不须要拆包和封包,效率更高,但一样限制比较多,只适合在相同局域网中的主机使用。BGP
(边界网关协议)以此向网络中的路由器广播路由规则。和 hostgw 同样不须要拆包,可是实现成本较高。有了CNI才能在此基础上构建 Kubernetes 集群。
在小规模场景下使用 Docker 能够一键部署应用确实很方便,达到了一键部署的目的,可是当出现须要在几百台主机上进行多副本部署,须要管理这么多主机的运行状态以及服务的故障时须要在其余主机重启服务,想象一下就知道手动的方式不是一种可取的方案,这时候就须要利用 Kubernetes 这种更高维度的编排工具来管理了。Kubernetes 简称 K8S, 简单说 K8S 就是抽象了硬件资源,将 N 台物理机或云主机抽象成一个资源池,容器的调度交给 K8S 就像亲妈同样照顾咱们的容器,CPU 不够用就调度到一台足够使用的机器上,内存不知足要求就会寻找一台有足够内存的机器在上面建立对应的容器,服务由于某些缘由挂了, K8S 还会帮咱们自动迁移重启, 简直无微不至,至尊享受。咱们做为开发者只关心本身的代码,应用的健康由 K8S 保证。
这里就不介绍具体的安装方式了,若是使用 Windows 或者 MacOS 能够直接使用 Docker Desktop 下的 Kubernetes 选项一键安装单主机集群,也可使用 kind 工具 在本地模拟多集群 K8S。
K8S 调度的基本单位为 pod, 一个 pod 表示一个或多个容器。引用一本书里所说
之因此没有使用容器做为调度单位,是由于单一的容器没有构成服务的概念;例如 Web 应用作了先后端分例,须要一个 NodeJS 与 Tomcat 才能组成一个完整的服务,这样就须要部署两个容器来实现一个完整的服务,虽然也能够把他们都放到一个容器里,但这显然违反了一个容器即一个进程的核心思想 --《Service Mesh实战 - 用 istio软负载实现服务网格》
K8S 与传统 IaaS 系统的不一样:
IaaS 就是 Infrastructure as a service, 所谓基础设施即服务,开发者想要上线一个新应用须要申请主机,ip, 域名等一系列资源,而后登陆主机自行搭建所需环境,部署应用上线,这样不只不利于大规模操做,并且还增长了出错的可能,运维或开发这经常本身写脚本自动化完成,遇到一些差别再手动修改脚本,很是痛苦。
K8S 则是将基础设施可编程化,由原来的人工申请改成一个清单文件自动建立,开发者只须要提交一份文件,K8S 将会自动为你分配建立所需的资源。对这些设施的 CRUD 均可以经过程序的方式自动化操做。
为了了解 K8S 的基础概念,下面来部署一个 Node SSR 应用:
初始化应用模板
npm install create-next-app
npx create-next-app next-app
cd next-app
复制代码
建立好工程后给添加一个 Dockerfile 用来构建服务的镜像
Dockerfile
FROM node:8.16.1-slim as build COPY ./ /app WORKDIR /app RUN npm install RUN npm run build RUN rm -rf .git FROM node:8.16.1-slim COPY --from=build /app / EXPOSE 3000 WORKDIR /app CMD ["npm", "start"] 复制代码
这个 Dockerfile 作了两部分优化
构建镜像
docker build . --tag next-app
复制代码
以后咱们就能够向 Kubernetes 提出咱们应用的要求了。为了保证高可用,服务至少建立两个副本,咱们还须要一个应用的域名当这个域名请求到咱们集群上时自动转发到咱们的服务上。那么咱们对应的配置文件就能够这么写
Deployment.yaml
apiVersion: extensions/v1beta1 kind: Ingress metadata: name: app-ingress spec: rules: - host: next-app-server http: paths: - backend: serviceName: app-service servicePort: 80 --- kind: Service apiVersion: v1 metadata: name: app-service spec: selector: app: web ports: - port: 80 targetPort: 3000 --- apiVersion: apps/v1 kind: Deployment metadata: name: app-deployment spec: replicas: 2 selector: matchLabels: app: web template: metadata: labels: app: web spec: containers: - image: next-app name: next-app imagePullPolicy: IfNotPresent ports: - containerPort: 3000 复制代码
上面这个清单告诉 K8S:
next-app
, 服务端口为 3000,给我建立两个副本。next-app
。next-app-server
, 其指向刚刚的 Service。提交这份申请给 K8S。
kubectl apply -f ./Deployment.yaml
复制代码
接着就能够看到已经部署的 pod。
sh-4.4$ kubectl get pod
NAME READY STATUS RESTARTS AGE
app-deployment-594c48dbdb-4f4cg 1/1 Running 0 1m
app-deployment-594c48dbdb-snj54 1/1 Running 0 1m
复制代码
而后浏览器打开 Ingress 里配置的域名便可访问对应的应用(前提是这个域名可以打到你的 K8S 集群节点上)。
上面的清单主要建立了三种最多见资源来保证服务的运行, 这也是 Kubernetes 的最主要的三类资源。
Ingress
L7层负载均衡配置, 能够根据不一样的域名或者路径等信息指向不一样的 Service, Ingress 和 Nginx 很像,实际上 Ingress 的一种实现就是 Nginx, 因此能够将 Ingress 来当成 Nginx 来用,只不过咱们不须要手动修改 nginx.conf
,也不用手动重启 Nginx 服务。
Service
一组 pod 的抽象,用来选择提供同一服务的 pod。 因为 pod 是不稳定的,销毁重建常常发生,pod 的 ip 常常发生变化,因此须要一种抽象的资源 Service 来表示 pod 的位置。 Service 也是K8S内部服务发现机制,会自动将 Service 名称写入内部 DNS 记录中。
Deployment
副本控制器,用来管理维护 pod 的一种机制。经过 Deployment 能够指定副本数量,发布策略, 记录发布日志并支持回滚。
K8S 仅仅负责容器的编排,实际上若是部署应用还须要外部 Pipeline 的支持,代码的构建,静态检查,镜像的打包由 Pipeline 完成.
目前国内用的比较多的发布系统经常由下面几个服务组成: GitLab/GitHub, Jenkins, Sonar, Harbor。
因为容器便是一个进程,因此对容器的监控能够看做对咱们 NodeJS 进程的监控,K8S 生态里已经有不少成熟的容器监控方案,例如 Prometheus + Grafana, 使用此能够达到应用的非侵入式性能指标的收集包括: 网络IO / 磁盘IO / CPU / MEM。
一样对于日志收集,咱们在代码中能够直接使用console
的方式输出, 在容器维度再使用日志收集服务进行日志收集,一样的非侵入式, 代码层无感知,对开发者更加友好,将日志和服务解耦。
微服务架构是近两年愈来愈流行的一种前端架构组织方式,微服务架构须要有一种更加弹性灵活的部署方式。 使用 Docker 让咱们在复杂架构中抽象服务的最小单元,K8S 给自动维护大规模集群提供了可能。能够说微服务架构自然适合使用 K8S。
K8S 中使用 Service 来抽象一组 pod,而 Service 的选择器能够动态变动,因此了咱们不少可能的玩法, 好比蓝绿发布系统。
蓝绿发布是指发布过程当中新应用发布测试经过后,经过切换网关流量, 一键升级应用的发布方式, 在 K8S 中经过动态更新 Service 的选择器实现不一样版本的一键切换
下面使用上面的 Next.js
应用来演示一下蓝绿发布,仓库地址
git clone https://github.com/Qquanwei/test-ab-deploy cd test-ab-deploy docker build . --tag next-app:stable kubectl apply -f ./Deployment.yaml 复制代码
这里会将 next-app:stable
这个镜像部署到集群中,而且给 pod 打上 version: stable
的tag。
部署后打开显示以下。
接着,咱们部署 test 分支, 这个分支咱们会构建为 next-app:test
的镜像,而且部署时给这个pod打上 version: test
的标签。
git checkout test
docker build . --tag next-app:test
kubectl apply -f ./Deployment.yaml
复制代码
这时候咱们一共部署了两个版本的应用,并且都已经就绪状态。
可是因为咱们的 Service 为 version=stable
, 因此全部的请求并不会打到 test 版本上,仍然都会请求 stable 的服务。
当咱们用其余的方式已经验证 test 版本服务可用时, 例如配另一个 Service 用来测试(Good), 这时候能够下面一条指令切换当前的 Service 到 test 应用上。
kubectl apply -f ./switch-to-test.yaml
复制代码
执行完这条命令后,刷新页面能够看到以下。
经过切换 Service 的方式很轻松就实现了蓝绿发布的功能,并且是瞬间完成,由于 Service 是 K8S 里比较轻量的资源,不会和隔壁 Nginx 同样修改配置就要重启服务影响整个线上服务。固然实际生产环境会比演示更加严谨,可能有专门的平台以及审核人员进行每一个操做的二次验证。
对于蓝绿, 灰度发布方式,使用 K8S 能够较为轻松地实现,让咱们可以有更多的方式去验证想法。不过若是想实现更加高级的流量分配方案(例如A/B发布),须要复杂的流量管理策略 (鉴权,认证),就须要用到服务网格了。
Istio 是目前比较流行的服务网格框架,相比于 K8S 注重运行容器的管理, Istio 则是更注重容器之间组成的服务网格的流量传输。
下图是 Istio 捕获的官方示例的 bookinfo
微服务中服务的拓扑结构和一些数据指标。
使用 Istio 有两个明显的好处:
例如,咱们能够轻松对的不一样版本的 review 应用的 v1, v2, v3 版本进行动态权重分配。
不只仅能够对流量权重分配,并且还能够制定一些A/B方案,例如根据 URL 是否匹配请求不一样的版本应用,或者根据 Header 种下的 Cookie 进行用户的区分,从而请求不一样的应用。固然,面对行业场景不一样,Istio 还会诞生不少有趣的玩法。
不过缺点一样存在,Istio 实际上也是一个很复杂的系统,会对性能形成影响,并且会占用不小的系统资源。
K8S 是划时代的,随着将来的发展微服务化,云原生化将会是咱们的应用的主要形式,对于前端而言 K8S 无疑会改变现有前端的开发方式和前端架构,让前端可以更迅速地扩展,更稳定地交付,应用之间的联系也会越发紧密。沉寂已久的前端下一个三年相信将会是微服务架构的天下,K8S 做为微服务架构基础设施层也将会被愈来愈多的公司团队所重视。
本文发布自 网易云音乐前端团队,文章未经受权禁止任何形式的转载。咱们一直在招人,若是你刚好准备换工做,又刚好喜欢云音乐,那就 加入咱们!