Docker基础教程

1. Docker容器介绍

Docker是一个开源的容器引擎，可让开发者把他的应用和依赖环境打包到一个可移植的容器环境中。php

容器：能够理解为一个轻量级的“虚拟机”，应用程序的运行环境。html

Docker的特色：python

应用隔离
轻量级的虚拟化方案
扩展性，能够轻松扩展出成千上万的容器实例。
移植性，统一开发、测试、生产环境，能够在任意环境运行容器实例。

2. 容器与虚拟机的区别

虚拟机和容器的架构对比：mysql

经过对比容器和虚拟机的架构图，虚拟机拥有独占的操做系统，虚拟化比较完全，容器是共享操做系统经过资源隔离使得容器拥有独立的环境；虚拟机和容器都共享硬件资源。linux

所以容器比较“轻”，启动一个容器可能就是一个进程，能够秒级启动容器。nginx

3. Docker架构

主要包含下面几个部分：c++

Docker守护进程 (Docker daemon)
负责管理镜像、容器、容器网络、数据卷等。
Client
负责发送Docker操做指令, 平常主要经过client完成镜像和容器的管理。
镜像 (Image)
即容器的模版，镜像是能够继承的，镜像主要经过Dockerfile 文件定义。
镜像仓库 (Registry)
相似git仓库, 只不过镜像仓库用于存储镜像和管理镜像的版本。
容器
容器是经过镜像建立的，因此说容器是一个镜像运行的实例，相似面向对象编程中类和对象的关系。

4. 安装docker

下面以centos安装docker ce社区版本为例:git

//先安装一些依赖的驱动和配置yum
$ yum install -y yum-utils \ device-mapper-persistent-data \ lvm2 $ yum-config-manager \ --add-repo \ https://download.docker.com/linux/centos/docker-ce.repo //安装docker
$ yum install docker-ce docker-ce-cli containerd.io //启动docker
$ systemctl start docker //测试下是否安装成功, 这里运行一个hello-world镜像，正常的话会输出 Hello from Docker!
$ docker run hello-world

5. 容器基本用法

5.1. 快速入门

下面经过打包一个静态网站讲解容器的基本用法。
首先对于一个静态网站，咱们须要什么样的环境才能跑起来?github

对于静态网站，咱们只须要一个Nginx软件就能跑起来，下面一步步讲解怎么经过容器部署这个网站。
下面是网站的项目目录结构：redis

├── Dockerfile      // Docker镜像定义文件 └── site //网站代码目录，只是一个简单的静态网站，只有一个页面 └── index.html

5.1.1. 定义镜像

建立镜像，咱们首先须要定一个镜像，定义镜像的目的说白了就是咱们要在容器里面安装什么东西。

下面是Dockerfile的定义：'#' 井号表示注释.

#FROM 指令表示要继承的镜像，这里继承nginx官方镜像，版本号是1.15.6 #定义镜像，都是经过继承某个已经存在的镜像开始 FROM nginx:1.15.6 #设置工做目录 WORKDIR /workspace #/usr/share/nginx/html目录是nginx官方镜像的默认网站目录。 #复制site目录的内容, 到/usr/share/nginx/html目录。 COPY ./site/* /usr/share/nginx/html #删除掉/workspace的内容，由于上面的指令已经把网站内容复制到指定的目录，这里的内容如今没用了 RUN set -ex \ && rm -rf /workspace #重新设置工做空间 WORKDIR /usr/share/nginx/html #声明容器须要暴露的端口 #EXPOSE 80 #容器启动命令，这里启动nginx, 参数-g daemon off; 的意思是关闭nginx的守护进程模式。 #CMD ["nginx", "-g", "daemon off;"] # EXPOSE 和 CMD命令都被注释掉了，由于nginx基础镜像已经定义过了，因此这里不须要重复定义，这里只是为了讲解目的，说明下容器是怎么运行nginx的。

5.1.2. 建立镜像

下面咱们经过docker客户端建立镜像。

//先切换到项目的根目录 //经过docker build命令建立镜像 //格式: docker build -t 镜像名:版本号 上下文路径 //上下文路径的意思就是咱们须要把那个目录上传到docker守护进程做为镜像建立的工做目录。 //这里把当前目录做为上下文环境目录
$ docker build -t demo1:v1.0.0 . 执行成功会输出以下结果： Sending build context to Docker daemon 3.584kB     //先打包上传上下文目录内容
Step 1/3 : FROM nginx:1.15.6
1.15.6: Pulling from library/nginx          //下载nginx镜像
a5a6f2f73cd8: Already exists 67da5fbcb7a0: Pull complete e82455fa5628: Pull complete Digest: sha256:31b8e90a349d1fce7621f5a5a08e4fc519b634f7d3feb09d53fac9b12aa4d991 Status: Downloaded newer image for nginx:1.15.6
 ---> e81eb098537d      //下面开始执行咱们Dockerfile定义的命令
Step 2/3 : WORKDIR /usr/share/nginx/html ---> Running in 155da3e24b72 Removing intermediate container 155da3e24b72 ---> 608d1e7fc6cd Step 3/3 : COPY --chown=nginx:nginx . /usr/share/nginx/html ---> 894f22f15a7c Successfully built 894f22f15a7c Successfully tagged demo1:v1.0.0

//查看当前机器上的镜像，这个时候就看到刚才建立的demo1镜像
$ docker image ls REPOSITORY TAG IMAGE ID CREATED SIZE demo1 v1.0.0               894f22f15a7c        11 minutes ago      109MB

5.1.3. 启动容器/运行网站

启动容器的过程是：根据镜像启动容器 -> 容器根据Dockerfile配置CMD命令启动咱们应用。
下面启动demo1镜像，docker会建立一个容器运行nginx。

//经过docker run命令运行一个镜像 //命令格式: docker run -p 容器绑定的外部端口:容器内部端口 镜像:镜像版本
$ docker run -p 8080:80 demo1:v1.0.0

经过浏览器访问：http://localhost:8080 便可访问网站

5.2. Dockfile详解

下面介绍Dockfile经常使用的指令

5.2.1. FROM

FROM是Dockerfile 文件的第一条指令，标示要继承的镜像。

格式:
FROM image[:tag]

参数说明：
image : 镜像名或者镜像地址。
tag : 可选参数，镜像版本或者叫镜像标签。

例子：

#这里使用的是官方nginx镜像，标签为:1.15.6 FROM nginx:1.15.6 #这里使用的是完整的镜像地址，标签为：v1.3.0 FROM XXXX:v1.3.0

5.2.2. COPY

复制指令，主要用于复制目录和文件。
格式：
COPY [--chown=user:group] src dest

参数说明：
src : 待复制的文件或者目录
dest : 复制文件的目的地
--chown=user:group : 可选参数，设置复制文件或者目录的用户组

例子：

#复制./site/目录下面的全部文件，到/usr/share/nginx/html目录，同时设置文件的用户和组为nginx COPY --chown=nginx:nginx ./site/* /usr/share/nginx/html

5.2.3. RUN

用于执行命令
格式：
RUN command

只有一个参数command，就是咱们想要执行的命令。

5.2.4. CMD

用于设置容器默认执行的命令。
格式:
CMD ["executable","param1","param2"]

参数说明：
executable : 执行程序，能够包含完整路径
param1, param2 ...param N : 执行程序的任意参数

5.2.5. ENV

设置容器环境变量
格式：
ENV = ...

例子：

#用空格分隔键值对 ENV myName="John Doe" myCat="fluffy"

5.2.6. USER

用于设置执行RUN, CMD 和 ENTRYPOINT命令时候的以什么用的身份运行。
格式：
USER user[:group]

参数说明：
user : 用户名
group : 可选参数，用户组

注意：若是设置的用户不存在，则以root用户身份运行。例子:

#设置执行RUN、CMD、ENTRYPOINT的时候用户和组为www USER www:www

5.2.7. WORKDIR

用于为RUN、CMD、ENTRYPOINT、COPY命令设置工做目录。若是设置的工做目录不存在，则自动建立一个。

例子：

WORKDIR /path/to/workdir

5.3. .dockerignore文件

docker build命令在发送上下文目录的文件到docker守护进程以前，能够经过.dockerignore配置文件，设置须要过滤的文件或者目录。

.dockerignore文件保存在上下文目录的根目录。

.dockerignore例子:

.dockerignore配置语法相似.gitignore

# comment #忽略全部目录下面的.log后缀的文件 **/*.log #忽略data目录 /data #忽略全部的.md结尾的文件，除了README.md *.md !README.md

6. 镜像管理

镜像管理问题：

若是咱们为不一样的项目建立了多个镜像，每一个镜像又有多个版本怎么管理它们？
在服务器集群中要根据不一样的镜像建立容器，去哪里找到镜像呢？

为管理镜像咱们须要一个相似github的镜像仓库，Docker官方为咱们提供了一个公开的镜像仓库。官方仓库地址：https://hub.docker.com/, 在上面能够找到各类各样的镜像，相似nginx、redis、mysql这些知名的开源软件官方也到这里发布了本身的官方镜像。

提示：知名开源软件提供的官方镜像会有Official Image标记，这些镜像会比较可靠，其余的镜像都是网友上传的。

下载镜像不须要帐号密码，若是要发布本身的镜像就须要注册账号。

对于我的使用公开镜像固然没问题，可是对于公司就不行，对于公司要么本身搭建一个私有的镜像仓库，要么使用阿里云这种云平台提供的镜像服务，建立一个私有仓库。

不管是本身搭建的镜像仓库仍是使用公开的镜像仓库用法是同样的。

镜像仓库的用法相似git, 下面是镜像仓库的基本用法：

#登录仓库命令: #公开仓库不须要登陆 $ docker login --username=账号 仓库地址 #例子: #登录阿里云容器服务仓库 #回车后输入密码便可 docker login --username=123456@qq.com XXX #下载镜像, 命令格式 docker pull 镜像:[镜像版本号] #例子1: #下载nginx最新镜像 docker pull nginx #下载阿里云镜像仓库的镜像，镜像版本号为:v1.0.0 docker pull XXX:v1.0.0 #上传镜像，命令格式 docker push 镜像:[镜像版本号] #例子: #推送镜像，以前docker login命令登录到什么仓库，就推送到那里。 docker push XXX:v1.0.0

7. 容器数据管理

7.1. 镜像分层技术

一个Docker镜像是有多个layer(层)组成的；每一层都存储一些文件数据，每一层都是在另外一层的基础上进行CRUD操做，每一层只是记录相对前面几层的差别部分的文件数据，Docker镜像分层技术，很像git代码管理，git记录每一次代码文件的变化历史，每一次提交的版本都是上一个版本的差别部分。

注意：镜像每一层的文件数据都是只读的。

当建立一个容器的时候，会在顶层增长一层可写的容器层，咱们容器的数据都是写在这上面。

容器层的数据不是持久化的，删除容器数据就丢了。

例子:
Dockerfile定义以下

FROM ubuntu:15.04 COPY . /app RUN make /app CMD python /app/app.py

dockerfile由4条指令构成，建立镜像后，分层示意图以下：

从底层往上看，最底下的一层保存dockerfile的FROM指令运行后产生的数据，倒数第二层对应COPY指令复制文件产生的数据，以此类推。

你们能够看到每一层都一个ID，例如最底下一层的id为: d3a1f33e8a5a, 很像git的提交记录吧。

当根据镜像建立容器的时候会在顶层增长一层容器层（Container layer）, 保存容器运行的数据。

提示：docker能够分层缓存数据，若是本地镜像已经下载过对应层的数据，那么docker不会重复下载对应的层；因此有些镜像看起来几百M，可是瞬间就下载完成，缘由是分层缓存对应的数据。

下图是根据同一个镜像建立多个容器的状况：
每个容器都有本身单独的容器层（Container layer），容器之间数据是独立的；可是他们底层的镜像数据是同样的。

7.2. 容器文件数据管理

在Docker容器里面写文件数据，这些数据不是持久化的，随着容器被删除数据将会丢失，下面是Docker提供的容器文件数据管理方式。

主要支持下面三种方式管理文件数据：

Volumes
共享服务器上的某个目录，可是这个共享目录限制在/var/lib/docker/volumes/目录下面，由docker维护。
Bind mounts
共享服务器上的文件或者目录，相对于Volumes区别就是不限制目录，能够是系统任何位置。
tmpfs
这种方式文件数据保存在服务器内存中。

提示：不管使用那种方式管理容器文件数据，对容器内部来讲，看起来跟本地文件系统同样。区别就是真实数据保存在什么地方。

容器管理文件数据示意图：

7.2.1. Volumes方式

使用Volumes方式管理文件数据须要先建立volume数据卷，而后挂载到容器里面。

例子：

//建立数据卷 demo1-data
$ docker volume create demo1-data //查看当前机器建立的数据卷
$ docker volume ls #输出 DRIVER VOLUME NAME local demo1-data //查看数据卷详情, 能够查看数据具体保存在什么地方
$ docker volume inspect demo1-data #输出 [ { "CreatedAt": "2019-04-18T15:59:58+08:00", "Driver": "local", "Labels": {}, "Mountpoint": "/var/lib/docker/volumes/demo1-data/_data", "Name": "demo1-data", "Options": {}, "Scope": "local" } ] //删除数据卷
$ docker volume rm demo1-data //将建立好的数据卷挂载到容器里面
$ docker run -d --name demo1 -v demo1-data:/mnt/data demo1:v1.0.0 参数说明： -d : 让容器在后台运行. --name : 给容器起个名字. -v  : 挂载数据卷, 格式: -v 数据卷名字:容器目录 demo1:v1.0.0 : 镜像的名字

7.2.2. Bind mounts方式

任意目录或者文件挂载方式.
例子:

//通常咱们本地开发启动nginx，配置文件都是在本地，咱们但愿容器能够读取本地的nginx配置。 //这个例子是把主机上的nginx配置文件挂载到nginx容器的配置文件里面, 这里挂载的是文件。
$ docker run --name my-custom-nginx-container -v /host/path/nginx.conf:/etc/nginx/nginx.conf:ro -d nginx 参数说明: --name my-custom-nginx-container : 容器名字 -v /host/path/nginx.conf:/etc/nginx/nginx.conf:ro : -v 挂载参数，将主机上的/host/path/nginx.conf文件挂载到容器的/etc/nginx/nginx.conf文件，ro 参数只读的意思。 //除了上面的挂载文件，咱们也能够挂载目录, 接着上面的例子
$ docker run --name my-custom-nginx-container -v /host/path/nginx/conf:/etc/nginx/:ro -d nginx 参数说明： -v /host/path/nginx/conf:/etc/nginx/:ro ： 这里把主机的/host/path/nginx/conf目录以只读方式挂载到容器的/etc/nginx/目录。

7.2.3. tmpfs方式

tmpfs主要是将数据存储在主机内存中。
例子:

$ docker run -d --name demo1 --tmpfs /mnt/data demo1:v1.0.0 参数说明： --tmpfs /mnt/data ： 挂载主机内存空间到容器的/mnt/data目录

8. 容器互相通讯

在实际应用的时候咱们每每会启动多个容器，分别运行不一样应用，又或者为了负载均衡启动大量的容器实例；那么容器之间怎么通讯？

容器之间的通讯方式跟服务器之间的通讯方式差很少，除此以外在同一台主机的容器之间Docker支持直接互相链接的通讯方式。
容器之间的通讯方式大致上有两种：

基于tcp/ip的网络通讯。
同一台主机上建立容器的时候，使用--link参数链接本地的其余容器。

例子1：同一台主机上的容器之间经过link参数互联.

//启动一个redis server，容器名字叫: redis, redis其余参数配置默认
$ docker run -d --name redis //另外启动一个容器，链接redis容器, 这样在demo1容器内部可使用redis名字当成redis服务器地址
$ docker run -d --name demo1 --link redis demo1:v1.0.0 参数说明： --link ：链接容器， 格式: --link 容器名 , 链接多个容器，可使用多个--link参数便可

例子2：主机怎么访问容器里面的应用？
例如，本地开发测试，咱们使用容器运行应用，那么容器外面的主机怎么访问？

容器须要暴露容器内部的端口给主机，主机才能访问容器内部的应用。

//例如，咱们使用nginx容器部署了一个网站应用，nginx容器须要暴露80端口出来。
$ docker run --name myapp -p 8080:80 -d nginx 参数说明： -p  : 绑定端口参数，格式 -p 主机端口:容器内部端口

 主机端口能够任意选择，只要没被其余程序占用便可。

主机端口不必定要跟容器内部端口一致，只是咱们习惯用同样的端口，便于理解。

9. Docker经常使用命令

//查看正在运行的容器
$ docker ps

//启动容器 - 容器建立以后不须要再次使用docker run命令建立容器， 这个时候只要启动容器便可。 //启动容器名为redis的容器
$ docker start redis //关闭容器
$ docker stop redis //删除容器
$ docker rm redis //容器的启动、关闭、删除除了使用容器名字以外，还可使用容器id //例如:
$ docker stop f648f34beabb //执行容器里面的命令
$ docker exec -it redis bash 参数说明： -it ： 打开一个交互的终端。 redis ： 容器的名字叫作redis bash : 执行容器里面的bash命令 //上面这条命令的其实就是链接容器打开一个shell窗口，相似登陆服务器同样。 // 命令格式: docker exec 容器名 要执行的命令 //删除镜像
docker image rm 镜像名 //给镜像打标签
docker tag 镜像id 标签 例子: $ docker tag ImageId xxxx:v2.0.1

//清理未使用的镜像
$ docker image prune

10. Docker实践建议。

10.1. 尽可能减少镜像大小和layer。

不安装跟应用无关的软件，清理掉没有用的文件；例如咱们在编译安装软件的是最产生不少中间文件，安装成功后能够删除这些数据。
由于Docker镜像的层级是有限的，在Dockfile配置文件中FROM、COPY、RUN这些指令都会产生layer, 用的最多的主要是RUN指令，推荐把连续的多条RUN指令合并成一条。

例子:

FROM centos COPY . /app WORKDIR /app #安装依赖包 #下面每一条RUN指令都会产生一个layer, 光是RUN指令就产生了6个layer RUN yum -y install gcc automake autoconf libtool make gcc-c++ #编译安装 RUN ./configure RUN make RUN make install #清理安装文件 RUN rm -rf /app #清理yum 缓存 RUN yum clean all

优化后的Dockfile

FROM centos COPY . /app WORKDIR /app #经过&&把多条命令连成一条命令，每行末尾的反斜杠是为了可读性，一行书写一条命令。 #这里只会产生一个layer RUN yum -y install gcc automake autoconf libtool make gcc-c++ \ && ./configure \ && make \ && make install \ && rm -rf /app \ && yum clean all

10.2. 避免在容器里面存储数据

由于在实际生产环境中容器是常常被销毁、重建的，多是由于应用异常容器退出了，也多是某台服务器负载过高，容器被调度到别的服务器运行；当容器被销毁的时候存储在容器的数据会丢失。

生产环境中存储持久化数据通常有如下方案：

经过数据卷存储数据，通常能够选择把数据存储在主机服务器上、也能够存储在分布式文件系统上。
经过外部数据库、云存储、日志服务等可持久化的存储引擎或者第三方云服务存储数据。

10.3. 一个容器只跑一个应用

要保证容器的“轻”的特性，咱们通常不会把容器当成服务器来用，什么东西都往里面安装。

例如：咱们常常会在一台服务器上安装nginx、php、mysql、redis，同时部署一堆应用系统。
若是在容器这么干，升级维护就变得复杂了，并且不容易扩展，若是要升级redis，或者升级某个应用系统就得你们一块儿更新，并且还无法对里面的单个应用进行扩容。

一个容器跑一个应用，能够保证容器的轻量级特性，又相对独立，便于单独升级和扩容。

例如：一个PHP系统，须要nginx、 php fpm、 mysql、redis 那么镜像和容器能够这么设计。

镜像制做状况：

nginx + php-fpm + PHP系统源码制做一个镜像。
redis 单独一个镜像。
mysql 单独一个镜像。

容器状况：
根据上面的镜像制做状况，至少须要同时运行三个容器，上面的三个镜像分别创一个容器。

10.4. 为项目或者公司制做基础镜像

一个项目或者一个公司的基础环境通常都是同样的，没有必要每次都从新制做基础环境镜像。
例如一个项目的基础环境是: nginx + php-fpm + PHP扩展库(curl、kafka、redis、swoole)，咱们只要先根据环境须要制做一个基础镜像，项目只要继承这个基础镜像，而后设置项目本身的参数便可。

10.5. 容器应用主进程不能切换到后台运行。

容器经过CMD设置应用的启动命令，当容器启动应用的主进程后，应用主进程的生命周期就跟容器捆绑了，主进程退出，容器就退出了。

这个地方跟咱们通常服务器部署应用不同，通常在服务器部署应用都是把进程切换到后台保持运行就能够，容器部署应用不能切换到后台运行，不然容器会任务应用结束了，容器本身就退出了。

建立容器的时候能够经过-d参数把容器切换到后台运行，例如: docker run -d --name redis redis