AUFS又叫Another UnionFS,后来叫Alternative UnionFS,后来可能以为不够霸气,叫成Advance UnionFS。是个叫Junjiro Okajima(岡島順治郎)在2006年开发的,AUFS彻底重写了早期的UnionFS 1.x,其主要目的是为了可靠性和性能,而且引入了一些新的功能,好比可写分支的负载均衡。AUFS在使用上全兼容UnionFS,并且比以前的UnionFS在稳定性和性能上都要好不少,后来的UnionFS 2.x开始抄AUFS中的功能。可是他竟然没有进到Linux主干里,就是由于Linus不让,基本上是由于代码量比较多,并且写得烂(相对于只有3000行的union mount和10000行的UnionFS,以及其它平均下来只有6000行代码左右的VFS,AUFS竟然有30000行代码),因此,岡島不断地改进代码质量,不断地提交,不断地被Linus拒掉,因此,到今天AUFS都还进不了Linux主干(今天你能够看到AUFS的代码其实还好了,比起OpenSSL好N倍,要么就是Linus对代码的质量要求很是高,要么就是Linus就是不喜欢AUFS)。html
不过,好在有不少发行版都用了AUFS,好比:Ubuntu 10.04,Debian6.0, Gentoo Live CD支持AUFS,因此,也OK了。node
好了,扯完这些闲话,咱们仍是看一个示例吧(环境:Ubuntu 14.04)linux
首先,咱们建上两个目录(水果和蔬菜),并在这两个目录中放上一些文件,水果中有苹果和蕃茄,蔬菜有胡萝卜和蕃茄。算法
1
2
3
4
5
6
7
8
|
$ tree
.
├── fruits
│ ├── apple
│ └── tomato
└── vegetables
├── carrots
└── tomato
|
而后,咱们输入如下命令:docker
1
2
3
4
5
6
7
8
9
10
11
12
|
# 建立一个mount目录
$
mkdir
mnt
# 把水果目录和蔬菜目录union mount到 ./mnt目录中
$
sudo
mount
-t aufs -o
dirs
=.
/fruits
:.
/vegetables
none .
/mnt
# 查看./mnt目录
$ tree .
/mnt
.
/mnt
├── apple
├── carrots
└── tomato
|
咱们能够看到在./mnt目录下有三个文件,苹果apple、胡萝卜carrots和蕃茄tomato。水果和蔬菜的目录被union到了./mnt目录下了。shell
咱们来修改一下其中的文件内容:ubuntu
1
2
3
4
5
|
$
echo
mnt > .
/mnt/apple
$
cat
.
/mnt/apple
mnt
$
cat
.
/fruits/apple
mnt
|
上面的示例,咱们能够看到./mnt/apple的内容改了,./fruits/apple的内容也改了。bash
1
2
3
4
5
|
$
echo
mnt_carrots > .
/mnt/carrots
$
cat
.
/vegetables/carrots
$
cat
.
/fruits/carrots
mnt_carrots
|
上面的示例,咱们能够看到,咱们修改了./mnt/carrots的文件内容,./vegetables/carrots并无变化,反而是./fruits/carrots的目录中出现了carrots文件,其内容是咱们在./mnt/carrots里的内容。app
也就是说,咱们在mount aufs命令中,咱们没有指它vegetables和fruits的目录权限,默认上来讲,命令行上第一个(最左边)的目录是可读可写的,后面的全都是只读的。(通常来讲,最前面的目录应该是可写的,然后面的都应该是只读的)负载均衡
因此,若是咱们像下面这样指定权限来mount aufs,你就会发现有不同的效果(记得先把上面./fruits/carrots的文件删除了):
1
2
3
4
5
6
7
8
9
|
$
sudo
mount
-t aufs -o
dirs
=.
/fruits
=rw:.
/vegetables
=rw none .
/mnt
$
echo
"mnt_carrots"
> .
/mnt/carrots
$
cat
.
/vegetables/carrots
mnt_carrots
$
cat
.
/fruits/carrots
cat
: .
/fruits/carrots
: No such
file
or directory
|
如今,在这状况下,若是咱们要修改./mnt/tomato这个文件,那么到底是哪一个文件会被改写?
1
2
3
4
5
6
7
|
$
echo
"mnt_tomato"
> .
/mnt/tomato
$
cat
.
/fruits/tomato
mnt_tomato
$
cat
.
/vegetables/tomato
I am a vegetable
|
可见,若是有重复的文件名,在mount命令行上,越往前的就优先级越高。
你能够用这个例子作一些各类各样的试验,我这里主要是给你们一个感性认识,就不展开试验下去了。
那么,这种UnionFS有什么用?
历史上,有一个叫Knoppix的Linux发行版,其主要用于Linux演示、光盘教学、系统急救,以及商业产品的演示,不须要硬盘安装,直接把CD/DVD上的image运行在一个可写的存储设备上(好比一个U盘上),其实,也就是把CD/DVD这个文件系统和USB这个可写的系统给联合mount起来,这样你对CD/DVD上的image作的任何改动都会在被应用在U盘上,因而乎,你能够对CD/DVD上的内容进行任意的修改,由于改动都在U盘上,因此你改不坏原来的东西。
咱们能够再发挥一下想像力,你也能够把一个目录,好比你的源代码,做为一个只读的template,和另外一个你的working directory给union在一块儿,而后你就能够作各类修改而不用惧怕会把源代码改坏了。有点像一个ad hoc snapshot。
Docker把UnionFS的想像力发挥到了容器的镜像。你是否还记得我在介绍Linux Namespace上篇中用mount namespace和chroot山寨了一镜像。如今当你看过了这个UnionFS的技术后,你是否是就明白了,你彻底能够用UnionFS这样的技术作出分层的镜像来。
下图来自Docker的官方文档Layer,其很好的展现了Docker用UnionFS搭建的分层镜像。
关于docker的分层镜像,除了aufs,docker还支持btrfs, devicemapper和vfs,你可使用 -s 或 –storage-driver= 选项来指定相关的镜像存储。在Ubuntu 14.04下,docker默认Ubuntu的 aufs(在CentOS7下,用的是devicemapper,关于devicemapper,我会以之后的文章中讲解)你能够在下面的目录中查看相关的每一个层的镜像:
1
|
/var/lib/docker/aufs/diff/
<
id
>
|
在docker执行起来后(好比:docker run -it ubuntu /bin/bash ),你能够从/sys/fs/aufs/si_[id]目录下查看aufs的mount的状况,下面是个示例:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
|
#ls /sys/fs/aufs/si_b71b209f85ff8e75/
br0 br2 br4 br6 brid1 brid3 brid5 xi_path
br1 br3 br5 brid0 brid2 brid4 brid6
# cat /sys/fs/aufs/si_b71b209f85ff8e75/*
/var/lib/docker/aufs/diff/87315f1367e5703f599168d1e17528a0500bd2e2df7d2fe2aaf9595f3697dbd7
=rw
/var/lib/docker/aufs/diff/87315f1367e5703f599168d1e17528a0500bd2e2df7d2fe2aaf9595f3697dbd7-init
=ro+wh
/var/lib/docker/aufs/diff/d0955f21bf24f5bfffd32d2d0bb669d0564701c271bc3dfc64cfc5adfdec2d07
=ro+wh
/var/lib/docker/aufs/diff/9fec74352904baf5ab5237caa39a84b0af5c593dc7cc08839e2ba65193024507
=ro+wh
/var/lib/docker/aufs/diff/a1a958a248181c9aa6413848cd67646e5afb9797f1a3da5995c7a636f050f537
=ro+wh
/var/lib/docker/aufs/diff/f3c84ac3a0533f691c9fea4cc2ceaaf43baec22bf8d6a479e069f6d814be9b86
=ro+wh
/var/lib/docker/aufs/diff/511136ea3c5a64f264b78b5433614aec563103b4d4702f3ba7d4d2698e22c158
=ro+wh
64
65
66
67
68
69
70
/run/shm/aufs
.xino
|
你会看到只有最顶上的层(branch)是rw权限,其它的都是ro+wh权限只读的。
关于docker的aufs的配置,你能够在/var/lib/docker/repositories-aufs这个文件中看到。
AUFS有全部Union FS的特性,把多个目录,合并成同一个目录,并能够为每一个须要合并的目录指定相应的权限,实时的添加、删除、修改已经被mount好的目录。并且,他还能在多个可写的branch/dir间进行负载均衡。
上面的例子,咱们已经看到AUFS的mount的示例了。下面咱们来看一看被union的目录(分支)的相关权限:
权限中,咱们看到了一个术语:whiteout,下面我来解释一下这个术语。
通常来讲ro的分支都会有wh的属性,好比 “[dir]=ro+wh”。所谓whiteout的意思,若是在union中删除的某个文件,其实是位于一个readonly的分支(目录)上,那么,在mount的union这个目录中你将看不到这个文件,可是read-only这个层上咱们没法作任何的修改,因此,咱们就须要对这个readonly目录里的文件做whiteout。AUFS的whiteout的实现是经过在上层的可写的目录下创建对应的whiteout隐藏文件来实现的。
看个例子:
假设咱们有三个目录和文件以下所示(test是个空目录):
1
2
3
4
5
6
7
8
9
|
# tree
.
├── fruits
│ ├── apple
│ └── tomato
├──
test
└── vegetables
├── carrots
└── tomato
|
咱们以下mount:
1
2
3
4
5
6
|
# mkdir mnt
# mount -t aufs -o dirs=./test=rw:./fruits=ro:./vegetables=ro none ./mnt
# # ls ./mnt/
apple carrots tomato
|
如今咱们在权限为rw的test目录下建个whiteout的隐藏文件.wh.apple,你就会发现./mnt/apple这个文件就消失了:
1
2
3
4
|
# touch ./test/.wh.apple
# ls ./mnt
carrots tomato
|
上面这个操做和 rm ./mnt/apple是同样的。
Branch – 就是各个要被union起来的目录(就是我在上面使用的dirs的命令行参数)
Whiteout 和 Opaque
看到上面这些,你必定会有几个问题:
其1、你可能会问,要有文件在原来的地方被修改了会怎么样?mount的目录会一块儿改变吗?答案是会的,也能够是不会的。由于你能够指定一个叫udba的参数(全称:User’s Direct Branch Access),这个参数有三个取值:
其2、若是有多个rw的branch(目录)被union起来了,那么,当我建立文件的时候,aufs会建立在哪里呢? aufs提供了一个叫create的参数能够供你来配置至关的建立策略,下面有几个例子。
create=rr | round−robin 轮询。下面的示例能够看到,新建立的文件轮流写到三个目录中
1
2
3
4
5
6
7
8
9
10
|
hchen$
sudo
mount
-t aufs -o
dirs
=.
/1
=rw:.
/2
=rw:.
/3
=rw -o create=rr none .
/mnt
hchen$
touch
.
/mnt/a
.
/mnt/b
.
/mnt/c
hchen$ tree
.
├── 1
│ └── a
├── 2
│ └── c
└── 3
└── b
|
create=mfs[:second] | most−free−space[:second] 选一个可用空间最好的分支。能够指定一个检查可用磁盘空间的时间。
create=mfsrr:low[:second] 选一个空间大于low的branch,若是空间小于low了,那么aufs会使用 round-robin 方式。
更多的关于AUFS的细节使用参数,你们能够直接在Ubuntu 14.04下经过 man aufs 来看一下其中的各类参数和命令。
AUFS的性能慢吗?也慢也不慢。由于AUFS会把全部的分支mount起来,因此,在查找文件上是比较慢了。由于它要遍历全部的branch。是个O(n)的算法(很明显,这个算法有很大的改进空间的)因此,branch越多,查找文件的性能也就越慢。可是,一旦AUFS找到了这个文件的inode,那后之后的读写和操做原文件基本上是同样的。
因此,若是你的程序跑在在AUFS下,open和stat操做会有明显的性能降低,branch越多,性能越差,可是在write/read操做上,性能没有什么变化。
IBM的研究中心对Docker的性能给了一份很是不错的性能报告(PDF)《An Updated Performance Comparison of Virtual Machinesand Linux Containers》
我截了两张图出来,第一张是顺序读写,第二张是随机读写。基本没有什么性能损失的问题。而KVM在随机读写的状况也就有点慢了(可是,若是硬盘是SSD的呢?)
顺序读写
随机读写