本文的原文地址是 What constitutes a good docker image?node
注:本文不会所有翻译,只会挑选我的认为有价值的部分进行摘取性翻译,如想详细阅读,请看原文python
在撰写本文时,ubuntu:14.04
为 195 MB,然而 debian:wheezy
是 85 MB,可是 Ubuntu 额外的几百兆字节不会给你带来任何价值(我所知道的)。在一些极端状况下,甚至可能你的基础镜像是 2 MB busybox
。这可能仅仅其实是二进制包的静态链接。linux
构建工具占用太多空间,而且从源码构建一般很慢。若是你只是安装别人的软件,一般不须要从源码构建,而且它应该被避免。好比,没有必要安装 python,gcc 等等。为了获取最新版本的 node.js 并运行在一台 Debian 主机上。在 node.js downloads page 这里有一个可用的二进制的压缩包。相似的,redis 能够经过包管理器安装。git
至少有几个很好的理由使用构建工具:github
npm install
安装一些模块来编译进二进制包在第二种状况下,好好的想清楚,你是否真应该这样作。在第三种状况下,我建议在另一个 "npm installer" 镜像安装构建工具,基于最小的 node.js 镜像。redis
下面的 Dockerfile
结果镜像大小是 109 MB:docker
FROM debian:wheezy RUN apt-get update && apt-get install -y wget RUN wget http://cachefly.cachefly.net/10mb.test RUN rm 10mb.test
在另外一方面,这看似至关的 Dockerfile
结果镜像大小是 99 MB:npm
FROM debian:wheezy RUN apt-get update && apt-get install -y wget RUN wget http://cachefly.cachefly.net/10mb.test && rm 10mb.test
所以看起来若是你在 Dockerfile
的两个步骤之间在磁盘空间留下了一个文件,当你删除这个文件的时候,空间不会被回收。也能够彻底避免临时文件,仅仅在命令行之间管道输出。好比:ubuntu
wget -O - http://nodejs.org/dist/v0.10.32/node-v0.10.32-linux-x64.tar.gz | tar zxf -
将提取压缩文件,并无把它放在文件系统上。缓存
若是你运行 apt-get update
设置你的容器,它在 /var/lib/apt/lists/
目录构成了数据,可是一旦镜像完成,这些数据是不须要的。你能够安全的清理那个目录来节约一些兆字节。
这个 Dockerfile
生成一个 99 MB 镜像:
FROM debian:wheezy RUN apt-get update && apt-get install -y wget
然而这个生成一个 90 MB 的镜像:
FROM debian:wheezy RUN apt-get update && apt-get install -y wget && rm -rf /var/lib/apt/lists/*
当一个 Docker 镜像是不可变的,一个 Dockerfile
是不保证在运行在不一样的时间生成相同的输出。这个问题,固然,是外部状态,而且咱们难以控制它。最好在某种程度上最小化你的 Dockerfile
外部状态的影响,这是有可能的。作这个的一个简单方式是指定包的版本,当经过包管理器更新的时候。这里有一个怎样作的示例:
# apt-get update # apt-cache showpkg redis-server Package: redis-server Versions: 2:2.4.14-1 ... # apt-get install redis-server=2:2.4.14-1
咱们所能但愿的是,可是这是没有保障的,包仓库从如今开始的一年仍然会是这个版本。尽管如此,明确的显示你镜像中依赖的软件版本是不能否认的价值。
若是你有一系列的相关命令,最好的方式是在一个命令中串联它们。这是一个更有意义的构建缓存(逻辑分组步骤集中到一个缓存步骤)并使得文件系统层级数量降下来了(我认为一般这是可取的,可是不知道在客观上是不是更好的)。
反斜线符号 \
在这里帮助你提高可读性:
RUN apt-get update && \ apt-get install -y \ wget=1.13.4-3+deb7u1 \ ca-certificates=20130119 \ ...
这是我阅读官方的 node.js Docker 镜像的 Dockerfile 学来的一个技巧。此外,这个 Dockerfile
是很是棒的。我惟一的指责就是它是基于一个巨大的 buildpack-deps 镜像,带着各类各样我不须要或不想要的东西。
你可使用 ENV
定义环境变量,而后在一系列的命令中引用它们。下面,我从连接的 Dockerfile
中转述了摘要:
ENV NODE_VERSION 0.10.32 RUN curl -SLO "http://nodejs.org/dist/v$NODE_VERSION/node-v$NODE_VERSION-linux-x64.tar.gz" \ && tar -xzf "node-v$NODE_VERSION-linux-x64.tar.gz" -C /usr/local --strip-components=1 \ && rm "node-v$NODE_VERSION-linux-x64.tar.gz"
上面这个版本信息,你只须要使用环境变量 NODE_VERSION
定义一次便可,而不用每次都写。