Docker：利用Linux容器实现可移植的应用部署

jopen 11年前

Docker是一种在Linux容器里运行应用的开源工具，一种轻量级的虚拟机。除了运行应用，Docker还提供了一些工具，借助Docker Index或自己托管的Docker注册表对进行了集装箱化处理的应用进行分发，从而简化复杂应用的部署过程。

我将在本文介绍如今在部署复杂系统时公司所面临的挑战，Docker怎样有效地解决这个问题，以及Docker的其他用例。

部署的挑战

服务器应用的部署已经越来越复杂了。把几个Perl脚本拷贝到正确目录就完成服务器应用的安装，这种时代已经一去不复返了。如今的软件有很多类型的需求：

对已安装软件和库的依赖（“Python版本高于2.6.3，使用Django 1.2”）
依赖于正在运行的服务（“需要一个MySQL 5.5数据库和一个RabbitMQ队列”）
依赖于特定的操作系统（“在64位的Ubuntu Linux 12.04上构建、测试”）
资源需求：
- 最小的可用内存（“需要1GB的可用内存”）
- 能绑定特定的端口（“绑定80和443端口”）
</li> </ul>
我们来看一个相对简单的应用的部署：Wordpress。Wordpress的安装通常要求：
- Apache 2
- PHP 5
- MySQL
- Wordpress源码
- 一个Wordpress MySQL数据库，配置Wordpress使用该数据库
- Apache的配置：
  - 加载PHP模块
  - 支持URL重写和.htaccess文件
  - 指向WordPress源码的DocumentRoot
  </li> </ul>
  在服务器上部署、运行这样一个系统，我们可能会遇到下面的问题和挑战：
  1. 隔离性：如果我们已经在这个服务器上部署了不同的网站，已有的网站只能在nginx上运行，而Wordpress依赖于Apache，这时我们就会有麻烦：它们都监听80端口。同时运行两个网站是可以的，但需要调整配置（修改监听端口），设置反向代理等。库级别也会出现类似的冲突，如果还要运行一个仍然依赖PHP4的老应用就会出问题，因为Wordpress不再支持PHP4，同时运行 PHP4和PHP5则非常困难。运行在同一个服务器上的应用没有互相隔离（在文件系统级别和网络级别），所以它们可能会互相冲突。
  2. 安全性：Wordpress的安全记录并不是非常好。所以还是给它创建个沙箱，至少黑客入侵时不会影响其他运行的应用。
  3. 升级、降级：升级应用一般会覆盖现有文件。升级过程中会发生什么？系统要关闭么？如果升级失败，或者不对该怎么办？我们怎样快速回退到先前的版本？
  4. 快照、备份：一旦所有的内容都设置好，就给系统创建一个“快照”，以便能备份快照，甚至能移到另一个服务器上再次启动，或者拷贝到多个服务器上以备不时之需。
  5. 重复性：系统出新版本之后，比较好的做法是先在测试基础设施上自动部署并测试，然后再发布到生产系统。通常会利用诸如Chef、Puppet等工具在服务器上自动安装一堆包，等一切内容都就绪后，再在生产系统上运行相同的部署脚本。这在百分之九十九的情况下都没有问题。但有百分之一的例外，在部署到测试环境和生产环境之间的时间跨度里，你依赖的包在包仓库里有了更新，而新版本并不兼容。结果生产环境的设置和测试环境不同，还有可能破坏生产系统。假如没有控制部署的每一个方面（例如托管自己的APT或YUM仓库），持续在多个阶段（比如测试、预演、生产环境）重复搭建出完全相同的系统就很困难。
  6. 资源限制：如果我们的Wordpress耗费CPU资源，并占用了所有的CPU周期，导致其他应用无法做任何事情怎么办？如果它用尽了全部可用的内存呢？或者疯狂写日志阻塞磁盘呢？要是能限制应用的可用资源，比如CPU、内存和磁盘空间，就会非常方便。
  7. 易于安装：也许有Debian或CentOS包，抑或是能自动执行所有复杂步骤并安装 Wordpress的Chef菜谱。但这些菜谱很难稳定下来，因为它们需要考虑目标系统上可能的系统配置。很多情况下，这些菜谱只能在干净的系统上运行。因此，你不太可能更换成自己的包或Chef菜谱。这样的话，安装就是个复杂的系统工程，而不是午休期间就能搞定的事情。
  8. 易于移除：软件应该能轻松、干净地移除，不留痕迹。但部署应用通常要调整已有的配置文件、设置状态（MySQL数据库的数据，日志），完全移除应用也变得不那么容易。
  那我们应该如何解决这些问题呢？
  
  虚拟机！
  
  我们决定在单独的虚拟机上运行独立的应用，例如Amazon的EC2，大部分问题这时会迎刃而解：
  1. 隔离性：在一个VM上安装一个应用，应用是完全独立的，除非它们攻入了对方的防火墙。
  2. 重复性：用你喜欢的方式准备系统，然后创建一个AMI。你可以随意实例化多个AMI实例。完全是可重现的。
  3. 安全性：由于我们完全隔离，如果Wordpress遭到攻击，其余的基础设施并不会受到影响——除非你没有保管好SSH密钥或者在哪里都使用同一个密码，但你应该不会这么做吧？
  4. 资源限制：VM会分配特定的CPU周期、可用内存和磁盘空间，没有加价的话就不能超额。
  5. 易于安装：越来越多的应用能够在EC2上运行，只要在AWS marketplace上点击一个按钮就能实例化应用。启动只需要几分钟，就是这样。
  6. 易于移除：不需要某个应用了？销毁VM。干净又方便。
  7. 升级、降级：Netflix如何部署代码里提到，只需要在新VM上部署新版本，然后让负载均衡器指向部署了新版本的VM。不过应用如果需要在本地保存状态，这种方法就不是很好用了。
  8. 快照、备份：点击一个按钮（或者调用一下API）就能获得EBS磁盘的快照，快照会备份到S3中。
  完美！
  
  不过……我们有个新问题：虚拟机在两个方面比较昂贵：
  - 金钱：你真的有那么多钱为每个应用启动一个EC2实例？另外你能预测到需要多少个实例么？如果你以后需要更多的资源，你需要停止VM进行升级——否则就要为闲置资源白白付钱，直到真正用起来（除非你用能动态调整大小的Solaris Zones，比如Joyent上的）。
  - 时间：虚拟机相关的操作大多都很慢：启动要几分钟，捕捉快照要几分钟，创建镜像也需要几分钟。世界不停转动，我们可没有这种时间！
  我们能做得更好吗？
  
  进入Docker的世界吧。
  
  Docker是由公共PaaS提供商dotCloud的人发起的开源项目，于去年初发起。从技术角度来说，Docker（主要用Go语言编写）试图简化两种已有技术的使用：
  - LXC：Linux容器，允许独立进程在比普通Unix进程更高的隔离级别上运行。使用的技术术语是集装箱化：一个容器里运行一个进程。容器支持的隔离级别有：
    - 文件系统：容器只能访问自己的沙箱文件系统（类似于chroot），否则要专门挂载到容器的文件系统中才能访问。
    - 用户名字空间：容器有自己的用户数据库（也就是容器的root不等于主机的root账户）。
    - 进程名字空间：只有容器里的进程才是可见的（ps aux的输出会非常简洁）。
    - 网络名字空间：每个容器都有自己的虚拟网络设备和虚拟IP（因此它可以绑定任意端口，不用占用主机端口）。
    </li>
  - AUFS：高级多层的统一文件系统，可用来创建联合、写时拷贝的文件系统。

Docker：利用Linux容器实现可移植的应用部署

部署的挑战

虚拟机！

怎么使用Docker

使用Dockerfile构建镜像

Docker用例

Docker不是什么

结论

相关资讯