详解Docker存储驱动
目的
- 理解docker的存储方式
- docker的image和container在host上的目录结构
- docker image和container的内容与配置不同存储
Docker是一个开源的应用容器引擎,主要利用Linux内核namespace实现沙盒隔离,用Cgroup实现资源限制。Docker用于统 一开发和部署的轻量级 Linux 容器,试图解决“依赖地狱”问题,把依赖的服务和组件组合起来,类似船舶使用的集装箱,达到快速安装部署。
1. Docker的基本架构—Client和Daemon
让我们先搞明白docker的基本架构和启动过程,其实Docker 采用了C/S架构,包括客户端和服务端。Docker daemon作为服务端接受来自客户的请求,并处理这些请求(创建、运行、提交容器)。 客户端和服务端在一个机器上,通过RESTful API 来进行通信。 具体到使用的过程中,就是在执行service docker start后,在主机(host)上产生docker deamon守护进程,在后台运行并等待接收来自客户端的消息(即输入的docker命令,如docker pull xxx,docker run …,docker commit xxx),实现跟docker deamon的交互。当启动docker服务后,可以看到docker进程。
[root@localhost ~]# ps -aux | grep docker root 11701 0.0 0.4 359208 16624 ? Ssl 21:05 0:00 /usr/bin/docker -d -H fd:// --selinux-enabled --insecure-registry 186.100.8.216:5000 root 11861 0.0 0.0 113004 2256 pts/0 S+ 23:01 0:00 grep --color=auto docker
说明这个,主要是后面指定文件系统的时候,需要先在/etc/sysconfig/docker的配置具体的storage driver(这个会写一篇专门的Blog),然后再启动Docker Daemon,而不能通过run命令的参数进行操作。还可以直接在host命令行通过docker –d进行设置。
2. Docker的存储方式—Storage Driver
Docker模型的核心部分是有效利用分层镜像机制,镜像可以通过分层来进行继承,基于基础镜像(没有父镜像),可以制作各种具体的应用镜像。不同 Docker 容器就可以共享一些基础的文件系统层,同时再加上自己独有的改动层,大大提高了存储的效率。其中主要的机制就是分层模型和将不同目录挂载到同一个虚拟文件 系统下(unite several directories into a single virtual filesystem,来自这篇文章)。 针对镜像存储docker采用了几种不同的存储drivers,包括:aufs,devicemapper,btrfs 和overlay(来自官网)。下面简单对不同的存储drivers做个介绍。
AUFS
AUFS(AnotherUnionFS)是一种联合文件系统。 AUFS 支持为每一个成员目录(类似 Git 的分支)设定只读(readonly)、读写(readwrite)和写出(whiteout-able)权限, 同时 AUFS 里有一个类似分层的概念, 对只读权限的分支可以逻辑上进行增量地修改(不影响只读部分的)。AUFS唯一一个storage driver可以实现容器间共享可执行及可共享的运行库, 所以当你跑成千上百个拥有相同程序代码或者运行库时时候,AUFS是个相当不错的选择。
Device mapper
Device mapper 是 Linux 2.6 内核中提供的一种从逻辑设备到物理设备的映射框架机制,在该机制下,用户可以很方便的根据自己的需要制定实现存储资源的管理策略(详见) 。Device mapper driver 会创建一个100G的简单文件包含你的镜像和容器,每一个容器被限制在10G大小的卷内(注意:这是利用loopback自动创建的稀疏文件,具体为 /var/lib/docker/devicemapper/devicemapper下的data和metadata,可动态扩张)。可以调整 Docker容器的大小,具体参考) 你可以在启动docker daemon时用参数-s 指定driver,也就是可以docker -d -s devicemapper设置docker的存储driver。先关闭docker服务,执行命令:
[root@localhost ~]# docker -d -s devicemapper INFO[0000] +job serveapi(unix:///var/run/docker.sock) INFO[0000] Listening for HTTP on unix (/var/run/docker.sock) INFO[0000] +job init_networkdriver() INFO[0000] -job init_networkdriver() = OK (0) INFO[0000] Loading containers: start. .... INFO[0000] Loading containers: done. INFO[0000] docker daemon: 1.4.0 4595d4f/1.4.0; execdriver: native-0.2; graphdriver: devicemapper INFO[0000] +job acceptconnections() INFO[0000] -job acceptconnections() = OK (0)
另外,docker在启动容器的时候可以指定 –storage-opt 参数,但是现在只有devicemapper能够接受参数设置。后面会有针对性的Blog展示。
BTRFS
Btrfs Driver 在docker build可以很高效。但是跟 devicemapper 一样不支持设备间共享存储(参加官网)。Btrfs 支持创建快照(snapshot)和克隆(clone),还能够方便的管理多个物理设备。(详细了解可以参考IBM对Btrfs的介绍)
overlay
overlay跟AUFS很像,但是性能比AUFS好,有很好内存利用,现在已经合并入Linux内核3.18了。具体使用命令:docker –d –s overlay
官网的Note: It is currently unsupported on btrfs or any Copy on Write filesystem and should only be used over ext4 partitions.
3 Docker目录结构
Docker两个最重要的概念是镜像和容器。那么我们pull下来的镜像的存储在哪里呢?镜像运行容器启动后,我们的操作修改的内容存储在哪里呢? 因为具体的驱动不同,所以最终的实现效果不同。下面我们以Device Mapper存储driver为例,分析下docker的存储结构。
1. 进入/var/lib/docker目录,列出内容:
[root@localhost ~]# cd /var/lib/docker/ [root@localhost docker]# ls containers devicemapper execdriver graph init linkgraph.db repositories-devicemapper tmp trust volumes
根据目录的内容,可以明显的看到是使用了devicemapper driver。
注:以下显示的文件夹都是在/var/lib/docker下的。
2. pull的镜像文件存在哪个文件夹下呢?(参考)
pull的镜像信息保存在了graph文件夹下,镜像的内容存在了devicemapper/ devicemapper/data下。
3. 启动的容器运行在哪里呢?
启动的容器配置信息保存在containers里,查看了还有execdriver/native/。
容器里操作的内容保存在devicemapper/devicemapper/data下。
4. graph的角色
在Docker架构中扮演已下载容器镜像的保管者,以及已下载容器镜像之间关系的记录者。graph的本地目录中,关于每一个的容器镜像,具体存储 的信息有:该容器镜像的元数据(json),容器镜像的大小(layersize)信息,以及该容器镜像所代表的具体rootfs。
5. 实验测试:
- 初始没有启容器:
[root@localhost docker]# ll containers/ total 0
- 启动一个容器:
[root@localhost docker]# docker run -i -t --rm centos:7 /bin/bash [root@187a8f9d2865 /]#
所启动的容器的UUID=187a8f9d2865
- 启动容器前,查看查看/var/lib/docker/devicemapper/devicemapper/下文件的实际大小
[root@bhDocker216 docker]# du -h devicemapper/devicemapper/* 2.1G devicemapper/devicemapper/data 3.5M devicemapper/devicemapper/metadata
- 在host的主机上查看
[root@bhDocker216 docker]# ls containers/ 187a8f9d2865c2ac***91b981
查看启动的容器在UUID文件夹下面的内容:
[root@bhDocker216 containers]# ll 187a8f9d2865c2ac***91b981 total 24 -rw-------. 1 root root 273 Mar 5 23:59 187a8f9d2865***-json.log -rw-r--r--. 1 root root 1683 Mar 5 23:58 config.json -rw-r--r--. 1 root root 334 Mar 5 23:58 hostconfig.json -rw-r--r--. 1 root root 13 Mar 5 23:58 hostname -rw-r--r--. 1 root root 174 Mar 5 23:58 hosts -rw-r--r--. 1 root root 69 Mar 5 23:58 resolv.conf
- 在启动的容器添加文件,并查看。
先在运行的容器内创建一个文件:
[root@8a1e3ad05d9e /]# dd if=/dev/zero of=floppy.img bs=512 count=5760 5760+0 records in 5760+0 records out 2949120 bytes (2.9 MB) copied, 0.0126794 s, 233 MB/s
然后在/var/lib/docker/devicemapper/devicemapper/下查看文件:
[root@bhDocker216 docker]# du -h devicemapper/devicemapper/* 5.5G devicemapper/devicemapper/data 4.6M devicemapper/devicemapper/metadata
这地方大小有点出入,是因为先执行了# dd if=/dev/zero of=test.txt bs=1M count=8000,创建一个8G大小的文件,由于太慢我终止了,但是可以明确的看到在运行的容器里进行操作,两个文件夹都发生了改变(增加)。
- 查看graph,在只pull了一个镜像(Ubuntu14.10)的情况下,里面出现了7个长UUID命名的目录,这是怎么来的呢?
用docker images –tree列出镜像树形结构,我们可以看到镜像的分层存储结构。最终的Ubuntu(第7层)是基于第6层改动的,即这种逻辑上的树中第n层基于是第n- 1层改动的,n层依赖n-1层的image。第0层,大小为0,称为base image。
- graph/UUID目录下内容是啥呢?
[root@localhost graph]# ll 01bf15a18638145eb*** -h total 8.0K -rw-------. 1 root root 1.6K Mar 5 18:02 json -rw-------. 1 root root 9 Mar 5 18:02 layersize
查看layersize的内容:数字表示层的大小(单位:B)。 josn:保存了这个镜像的元数据(如:size,architecture,config,container,**parent的UUID**等等)。
- 查看devicemapper/devicemapper文件夹
有两个文件夹data和metadata,其实device mapper driver是就是把镜像和容器的文件 都存储在**data**这个文件内。可以通过docker info查看data和metadata的大小。 另外可以用du –h(上面有用到)查看这两个稀疏文件的实际大小。
- execdriver
[root@bhDocker216 docker]# ls execdriver/native/ 8a1e3ad05d9e66a455e683a2c***2437bdcccdfdfa //对里面的内容进行查看: [root@bhDocker216 8a1e3ad05d9e66a455e***]# ls container.json state.json
- volumes
没有加-v参数的volumes是空的,经测试如果启动容器增加加-v参数,volumes文件夹下将显示一个UUID,在host进行全局搜索,只在volumes下找到了,跟镜像和容器的UUID都没有关系。
[root@bhDocker216 docker]# find / -name 86eb77f9f5e25676f100***d5a /var/lib/docker/volumes/86eb77f9f5e25676f100***d5a //查看里面的内容: [root@bhDocker216 volumes]# ls 86eb77f9f5e25676f100***d5a config.json [root@bhDocker216 volumes]# cat 86eb77f9f5e25676f100***d5a /config.json {"ID":"86eb77f9f5e25676f100a89ba727bc15185303236aae0dcf4c17223e37651d5a","Path":"/home/data","IsBindMount":true,"Writable":true}
文件夹作用表格性说明
做个总结,整理一个表格,把/var/lib/docker下的不同文件夹作用说明下:
更多关于docker的技术文章,请访问:team blog