Shopify的Docker实战经验（二）如何用容器支持10万的在线商店

jopen 10年前

Shopify是一个电子商务平台，提供专业的网上店面。目前的客户超过12万，包括GE、特斯拉汽车、GitHub等。作为首家市值超过10亿美元的加拿大网络公司，Shopify在欧美市场的影响力也与日俱增。Shopify是一个大型的Ruby on Rails应用，其产品服务器能通过给1700个处理核心和6TB RAM分配任务来完成每秒处理8000多个请求。Shopify在其博客上分享了系列内容来介绍他们的Docker使用经验。这是系列文章的第二篇，主要讲述Shopify如何使用Docker支撑的容器化数据中心。

这是系列文章的第二篇，讲述Shopify如何使用Docker支撑的容器化数据中心。这篇文章重点介绍当用户访问Shopify商店门户的时候我们底层的生产环境是如何创建出容器的。

系列文章的第一篇在这里（中文翻译）。

为什么选择容器化？

在深入讨论构建容器的原理之前，先讨论下我们的动机。容器对于数据中心的作用可能类似于控制台对于游戏的作用。在PC游戏发展的早期阶段，游戏在玩之前一般都会要求显卡和声卡驱动massaging。然而，游戏控制台提供了不一样的方式：

可预测：cartridge是自包含的：随时可用，无需下载或更新。
快速：cartridge使用只读内存，所以可以非常快。
简易：cartridge健壮并且被大范围证明 - 仅需插上即可游戏。

可预测、快速、简易都是闪亮的优点。Docker容器提供了构建模块，可以将应用放到自包含，随时可运行的单元里，这样使得运行数据中心更为简单，也更加灵活，就像cartridge带给控制台游戏的改进一样。

Bootstrapping

要完成容器化的转变需要开发和运维的双方面配合。首先，需要和运维团队沟通，确保容器能够完全复制现在的生产环境。

如果你在OSX（或者Windows）上运行，部署到Linux上，需要使用虚拟机，比如Vagrant作为本地的测试环境。首先需要得到操作系统信息和其上需要安装的支持包。选择符合生产环境（我们用的是Ubuntu 14.04）的基础镜像，拒绝任何非紧急的系统升级请求，谁都不想同时既进行容器化改进又要升级操作系统/包。

选择容器封装格式

Docker提供封装格式的选择，从“纤薄”单进程容器到更像传统意义虚拟机的“胖”容器（比如， Phusion）。

我们选择了“纤薄”容器路径，并尽量隔绝外部影响。在这两种封装格式之间很难做决定，但是更小、更简单的容器消耗的CPU和内存更少。 Docker官方博客上有这种解决方案的更为详细的介绍。

环境搭建

我们使用Chef管理生产节点。虽然可以简单地在容器内部运行Chef，但是这会带进一些不想复制到每个容器里的服务（比如，日志索引和stats收集）。与其忍受重复，倒不如给每个Docker主机共享一个单独的这些服务的拷贝。

构建“纤薄”容器的路径要求把Chef请求转换成Dockerfile（后来我们更换成了自定义的构建流程 - 不过这在另一篇文章里讨论）。这样的转换也给了我们很好的机会去审查生产环境并记录下真正需要的东西（可能需要些考古学知识）。尽可能得删除不需要的东西，并且在这一阶段安排尽可能多的代码审查。

这个过程其实没有听上去那么痛苦。我们最后得到了一个125行，包含很多注释的Dockerfile，它定义了Shopify所有容器共享的基础镜像。这个基础镜像包含25个包，涉及各种编程语言的运行时环境（Ruby、Python、Node），开发工具（Git、Vim、Build- essential、Go）和一些常用库。它还包括完成一些任务的实用脚本，比如，用优化的参数启动Ruby，或者给Datadog发送事件。

应用程序也可以向这个基础镜像添加特殊的需求。即使这样，我们最大的应用程序也只是另外添加了两个操作系统包，因此我们的基础镜像是非常精简的。

100法则

当选择将什么服务放到容器里时，先假定在一台主机上运行了100个小容器，然后，问自己是否真的需要运行100个这样的服务，还是最好只共享一台主机的服务。

以下是些实际例子，展示100法则如何影响我们的容器：

日志索引：日志对于诊断生产环境问题至关重要，在容器化的世界里更为重要，因为文件系统在容器退出后就消失了。我们尽量不要改变应用自己的日志行为（比如强制应用日志重定向到syslog中），而是应该允许应用继续记录日志到文件系统里。运行100个日志传递代理看上去并不合理，因此我们构建了一个后台程序来处理一些核心任务：
- 在宿主机器上运行，并订阅Docker事件
- 当容器启动时，配置日志索引器监控容器
- 当容器销毁时，移除索引指令
</li> </ul>
注意有时在容器退出后需要延迟容器的销毁从而确保所有的日志都建立了索引。
- 统计：Shopify进行多个层级的运行时统计：系统，中间件和应用层面。统计数据通常是由代理转发或者从应用代码里直接发出。
  - 我们大部分统计数据是由StatsD收集的，也很幸运地能配置主机端的Datadog收集器来接受容器的消息（比如，网络流量和代理配置）。因为有这些配置，只需要将StatsD的地址转发到容器里就可以了。
  - 主机端系统监控代理能够跨越容器界限，因为容器归根到底就是个进程树。因此可以共享一个系统监控器。
  - 从容器为中心的视角看，要考虑Datadog的Docker集成，这样可以将Docker矩阵加入到主机端的监控代理上。
  - 应用级别上，大部分情况都可以工作，因为它们要么想要发送事件给StatsD，要么直接和其他服务通信。定义容器的名字很重要，这样日志里才会记录下有效名字。
  </li>
- Kafka：我们使用Kafka作为事件总线将Shopify的实时事件传送到感兴趣的组件里。构建消息并将其放置到SysV消息队列，这样可以将Ruby on Rails里的Kafka事件发布出去。一个简单的用Go写的后台程序会清空队列并且发送消息给Kafka。这样的架构减少了Ruby处理时间，帮助我们很好地解决了Kafka服务器过载的问题。不幸的是，SysV消息队列是IPC命名空间的一部分，所以我们无法为容器使用队列：主机连接。我们通过给主机添加了一个socket接入点，使用其将消息放到SysV队列里来解决了这个问题。当然，我们需要将这个接入点的地址通过环境变量传递给容器。另外一篇文章详细介绍了这个问题。

Shopify的Docker实战经验（二）如何用容器支持10万的在线商店

为什么选择容器化？

Bootstrapping

选择容器封装格式

环境搭建

100法则

容器化应用

调试及其细节

进程层次结构

Signals

主机名

注册和部署

相关经验

目录