Docker基础-使用Dockerfile建立镜像

一、基本结构

  Dockerfile由一行行命令语句组成,并支持以#开头的注释行。例如:python

# This dockerfile uses the ubuntu image
# VERSION 2 - EDITION 1
# Author: docker_user
# Command format: Instruction [arguments / command ] ..

# Base image to use, this nust be set as the first line
FROM ubuntu

# Maintainer: docker_user <docker_user at email.com> (@docker_user)
MAINTAINER docker_user docker_user@email.com

# Commands to update the image
RUN echo "deb http://archive.ubuntu.com/ubuntu/ raring main universe" >> /etc/apt/sources.list
RUN apt-get update && apt-get install -y nginx
RUN echo "\ndaemon off;" >> /etc/nginx/nginx.conf

# Commands when creating a new container
CMD /usr/sbin/nginx

  其中,开始必须指明所基于的镜像名称,接下来通常是说明维护者信息。后面则是镜像操做指令,例如RUN指令,RUN指令将对镜像执行跟随的命令。每运行一条RUN指令,镜像就添加新的一层,并提交。最后是CMD指令,用来指定运行容器时的操做命令。linux

  Docker Hub上两个热门Dockerfile:nginx

  1.在debian:jessie基础镜像上安装nginx环境,从而建立一个新的nginx镜像:golang

FROM debian:jessie

MAINTAINER NGINX Docker Maintainers "docker-maint@nginx.com"

ENV NGINX_VERSION 1.10.1-1~jessie

RUN apt-key adv --keyserver hkp://pgp.mit.edu:80 --recv-keys 573BFD6B3D8FBC641079A6ABABF5BD827BD9BF62 && \
echo "deb http://nginx.org/package/debian/ jessie nginx" >> /etc/apt/source.list && apt-get update && \
apt-get install --no-install-recommends --no-install-suggests -y ca-certificates nginx=$(NGINX_VERSION) \
nginx-module-xslt nginx-module-geoip nginx-module-image-filter nginx-module-perl nginx-module-njs gettext-base && \
rm -rf /var/lib/apt/lists/*

# forward request and error logs to docker log collector
RUN ln -sf /dev/stdout /var/log/nginx/access.log && ln -sf /dev/stderr /var/log/nginx/err.log

EXPOSE 80 443

CMD ["nginx","-g","daemon off;"]

  2.基于buildpack-deps:jessie-scm基础镜像,安装golang相关环境,制做一个GO语言的运行环境。正则表达式

FROM buildpack-deps:jessie-scm

# gcc fo cgo
RUN apt-get update && apt-get install -y --no-install-recommends g++ gcc libc6-dev make && rm -rf /var/lib/apt/lists*

ENV GOLANG_VERSION 1.6.3
ENV GOLANG_DOWNLOAD_RUL https://golang.org/dl/go$GOLANG_VERSION.linux-amd64.tar.gz
ENV GOLANG_DOWNLOAD_SHA256 cdd5e08530c0579255d6153b08fdb3b8e47caabbe717bc7bcd7561275a87aeb

RUN curl -fssL "$GOLANG_DOWNLOAD_RUL" -o golang.tar.gz && \
echo "$GOLANG_DOWNLOAD_SHA256 golang.tar.gz" | sha256sum -c - && tar -C /usr/local -xzf golang.tar.gz && rm golang.tar.gz

ENV GOPATH $GOPATH/bin:/usr/local/go/bin:$PATH

RUN mkdir -p "$GOPATH/bin" && chmod -R 777 "$GOPATH"
WORKDIR $GOPATH

COPY go-wrapper /usr/local/bin

二、指令说明

  指令的通常格式为INSTRUNCTION arguments,指令包括FROM、MAINTAINER、RUN等。具体指令及说明以下:docker

指令 说明
FROM 指定所建立镜像的基础镜像
MAINTAINER 指定维护者信息
RUN 运行命令
CMD 指定启动容器时默认执行的命令
LABEL 指定生成镜像的元数据标签信息
EXPOSE 声明镜像内服务所监听的端口
ENV 指定环境变量
ADD 赋值指定的<src>路径下的内容到容器中的<dest>路径下,<src>能够为URL;若是为tar文件,会自动解压到<dest>路径下
COPY 赋值本地主机的<scr>路径下的内容到容器中的<dest>路径下;通常状况下推荐使用COPY而不是ADD
ENTRYPOINT 指定镜像的默认入口
VOLUME 建立数据挂载点
USER 指定运行容器时的用户名或UID
WORKDIR 配置工做目录
ARG 指定镜像内使用的参数(例如版本号信息等)
ONBUILD 配置当前所建立的镜像做为其余镜像的基础镜像时,所执行的建立操做的命令
STOPSIGNAL 容器退出的信号
HEALTHCHECK 如何进行健康检查
SHELL 指定使用SHELL时的默认SHELL类型

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1.FROM

  指定所建立的镜像的基础镜像,若是本地不存在,则默认会去Docker Hub下载指定镜像。
  格式为:FROM<image>,或FROM<image>:<tag>,或FROM<image>@<digest>。
  任何Dockerfile中的第一条指令必须为FROM指令。而且,若是在同一个Dockerfile文件中建立多个镜像,可使用多个FROM指令(每一个镜像一次)。shell

2.MAINTAINER

  指定维护者信息,格式为MAINTAINER<name>。例如:数据库

MAINTAINER image_creator@docker.com

  该信息将会写入生成镜像的Author属性域中。json

3.RUN

  运行指定命令。
  格式为:RUN<command>或RUN ["executable","param1","param2"]。
注意:
    后一个指令会被解析为json数组,因此必须使用双引号。
前者默认将在shell终端中运行命令,即/bin/sh -c;后者则使用exec执行,不会启动shell环境。
指定使用其余终端类型能够经过第二种方式实现,例如:
    RUN ["/bin/bash","-c","echo hello"]
每条RUN指令将在当前镜像的基础上执行指定命令,并提交为新的镜像。当命令较长时可使用\换行。例如:ubuntu

RUN apt-get update \
        && apt-get install -y libsnappy-dev zliblg-dev libbz2-dev \
        && rm -rf /var/cache/apt

4.CMD

  CMD指令用来指定启动容器时默认执行的命令。它支持三种格式:

1.CMD ["executable","param1","param2"] 使用exec执行,是推荐使用的方式;
2.CMD param1 param2 在/bin/sh中执行,提供给须要交互的应用;
3.CMD ["param1","param2"] 提供给ENTRYPOINT的默认参数。

  每一个Dockerfile只能有一条CMD命令。若是指定了多条命令,只有最后一条会被执行。入股用户启动容器时指定了运行的命令(做为run的参数),则会覆盖掉CMD指定的命令。

5.LABEL

  LABEL指令用来生成用于生成镜像的元数据的标签信息。
  格式为:LABEL <key>=<value> <key>=<value> <key>=<value> ...。
  例如:

LABEL version="1.0"
LABEL description="This text illustrates \ that label-values can span multiple lines."

6.EXPOSE

  声明镜像内服务所监听的端口。
  格式为:EXPOSE <port> [<port>...]
  例如:

EXPOSE 22 80 443 3306

注意:

  该命令只是起到声明租用,并不会自动完成端口映射。
       在容器启动时须要使用-P(大写P),Docker主机会自动分配一个宿主机未被使用的临时端口转发到指定的端口;使用-p(小写p),则能够具体指定哪一个宿主机的本地端口映射过来。

7.ENV

  指定环境变量,在镜像生成过程当中会被后续RUN指令使用,在镜像启动的容器中也会存在。
  格式为:ENV <key><value>或ENV<key>=<value>...。
  例如:

ENV GOLANG_VERSION 1.6.3
ENV GOLANG_DOWNLOAD_RUL https://golang.org/dl/go$GOLANG_VERSION.linux-amd64.tar.gz
ENV GOLANG_DOWNLOAD_SHA256 cdd5e08530c0579255d6153b08fdb3b8e47caabbe717bc7bcd7561275a87aeb

RUN curl -fssL "$GOLANG_DOWNLOAD_RUL" -o golang.tar.gz && echo "$GOLANG_DOWNLOAD_SHA256 golang.tar.gz" | sha256sum -c - && tar -C /usr/local -xzf golang.tar.gz && rm golang.tar.gz

ENV GOPATH $GOPATH/bin:/usr/local/go/bin:$PATH

RUN mkdir -p "$GOPATH/bin" && chmod -R 777 "$GOPATH"

  指令指定的环境变量在运行时能够被覆盖掉,如docker run --env <key>=<value> built_image。

8.ADD

  该指令将复制指定的<src>路径下的内容到容器中的<dest>路径下。
  格式为:ADD<src> <dest>
  其中<src>可使Dockerfile所在目录的一个相对路径(文件或目录),也能够是一个URL,还能够是一个tar文件(若是是tar文件,会自动解压到<dest>路径下)。<dest>可使镜像内的绝对路径,或者至关于工做目录(WORKDIR)的相对路径。路径支持正则表达式,例如:

ADD *.c /code/

9.COPY

  复制本地主机的<src>(为Dockerfile所在目录的一个相对路径、文件或目录)下的内容到镜像中的<dest>下。目标路径不存在时,会自动建立。路径一样支持正则。
  格式为:COPY <src> <dest>
  当使用本地目录为源目录时,推荐使用COPY。

10.ENTRYPOINT

  指定镜像的默认入口命令,该入口命令会在启动容器时做为根命令执行,全部传入值做为该命令的参数。
  支持两种格式:

1.ENTRYPOINT ["executable","param1","param2"] (exec调用执行);
2.ENTRYPOINT command param1 param2(shell中执行)。

  此时,CMD指令指定值将做为根命令的参数。
  每一个Dockerfile中只能有一个ENTRYPOINT,当指定多个时,只有最后一个有效。
  在运行时能够被--entrypoint参数覆盖掉,如docker run --entrypoint。

11.VOLUME

  建立一个数据卷挂载点。
  格式为:VOLUME ["/data"]
  能够从本地主机或者其余容器挂载数据卷,通常用来存放数据库和须要保存的数据等。

12.USER

  指定运行容器时的用户名或UID,后续的RUN等指令也会使用特定的用户身份。
  格式为:USER daemon
  当服务不须要管理员权限时,能够经过该指令指定运行用户,而且能够在以前建立所须要的用户。例如:

RUN groupadd -r nginx && useradd -r -g nginx nginx

  要临时获取管理员权限能够用gosu或者sudo。

13.WORKDIR

  为后续的RUN、CMD和ENTRYPOINT指令配置工做目录。
  格式为:WORKDIR /path/to/workdir。
  可使用多个WORKDIR指令,后续命令若是参数是相对的,则会基于以前命令指定的路径。例如:

WORKDIR /a
WORKDIR b
WORKDIR c
RUN pwd

  则最终路径为/a/b/c

14.ARG

  指定一些镜像内使用的参数(例如版本号信息等),这些参数在执行docker build命令时才以--build-arg<varname>=<value>格式传入。
  格式为:ARG<name>[=<default value>]。
  则能够用docker build --build-arg<name>=<value>来指定参数值。

15.ONBUILD

  配置当所建立的镜像做为其余镜像的基础镜像的时候,所执行建立操做指令。
  格式为:ONBUILD [INSTRUCTION]。
  例如Dockerfile使用以下的内容建立了镜像image-A:

[...]
ONBUILD ADD . /app/src
ONBUILD RUN /usr/local/bin/python-build --dir /app/src
[...]

  若是基于image-A镜像建立新的镜像时,新的Dockerfile中使用FROM image-A指定基础镜像,会自动执行ONBUILD指令的内容,等价于在后面添加了两条指令:

FROM image-A

# Automatically run the following
ONBUILD ADD . /app/src
ONBUILD RUN /usr/local/bin/python-build --dir /app/src

  使用ONBUILD指令的镜像,推荐在标签中注明,例如:ruby:1.9-onbuild。

16.STOPSIGNAL

  指定所建立镜像启动的容器接收退出的信号值。例如:

STOPSIGNAL singnal

17.HEALTHCHECK

  配置所启动容器如何进行健康检查(如何判断是否健康),自Docker 1.12开始支持。
  格式有两种:

1.HEALTHCHECK [OPTIONS] CMD command    :根据所执行命令返回值是否为0判断;
2.HEALTHCHECK NONE              :禁止基础镜像中的健康检查。

  [OPTION]支持:

1.--inerval=DURATION  (默认为:30s):多久检查一次;
2.--timeout=DURATION  (默认为:30s):每次检查等待结果的超时时间;
3.--retries=N        (默认为:3):若是失败了,重试几回才最终肯定失败。

18.SHELL

  指定其余命令使用shell时的默认shell类型。
  格式为: SHELL ["executable","parameters"]
  默认值为 ["bin/sh","-c"]。
  注意:
    对于Windows系统,建议在Dockerfile开头添加# escape=`来指定转移信息。

 

三、建立镜像

  编写玩Dockerfile以后,能够经过docker build命令来建立镜像。
  基本的docker build [选项] 内容路径,该命令将读取指定路径下(包括子目录)的Dockerfile,并将该路径下的全部内容发送给Docker服务端,由服务端来建立镜像。所以除非生成镜像须要,不然通常建议放置Dockerfile的目录为空目录。

1.若是使用非内容路径下的Dockerfile,能够经过-f选项来指定其路径;
2.要指定生成镜像的标签信息,可使用-t选项。

  例如:指定Dockerfile所在路径为 /tmp/docker_builder/,而且但愿生成镜像标签为build_repo/first_image,可使用下面的命令:

docker build -t build_repo/first_image /tmp/docker_builder

四、使用 .dockerignore文件

  能够经过 .dockeringore文件(每一行添加一条匹配模式)来让Docker忽略匹配模式路径下的目录和文件。例如:

# comment
    */tmp*
    */*/tmp*
    tmp?
    ~*

五、Dockerfile编写小结

  从需求出发,定制适合本身需求、高效方便的镜像,能够参考他人优秀的Dockerfile文件,在构建中慢慢优化Dockerfile文件:

1.精简镜像用途:                 尽可能让每一个镜像的用途都比较集中、单一,避免构造大而复杂、多功能的镜像;
2.选用合适的基础镜像:            过大的基础镜像会形成构建出臃肿的镜像,通常推荐比较小巧的镜像做为基础镜像;
3.提供详细的注释和维护者信息:     Dockerfile也是一种代码,须要考虑方便后续扩展和他人使用;
4.正确使用版本号:               使用明确的具体数字信息的版本号信息,而非latest,能够避免没法确认具体版本号,统一环境;
5.减小镜像层数:                减小镜像层数建议尽可能合并RUN指令,能够将多条RUN指令的内容经过&&链接;
6.及时删除临时和缓存文件:        这样能够避免构造的镜像过于臃肿,而且这些缓存文件并无实际用途;
7.提升生产速度:                合理使用缓存、减小目录下的使用文件,使用.dockeringore文件等;
8.调整合理的指令顺序:           在开启缓存的状况下,内容不变的指令尽可能放在前面,这样能够提升指令的复用性;
9.减小外部源的干扰:             若是确实要从外部引入数据,须要制定持久的地址,并带有版本信息,让他人能够重复使用而不出错。