在Docker上运行Apache Kafka
在研究Apache Kafka和Docker时,作者发现Docker是一个非常神奇的技术,它将开发过程简化的如此完美。又因为有wurstmeister/kafka和 wurstmeister/zookeeper这两个镜像,运行Apache Kafka和使用Docker是那样的轻松,还有比这更让人觉得兴奋的事情么!让我们完全从安装、维护机器和软件中解脱出来。
一直很想鼓捣Apache Kafka,但由于我想鼓捣的事太多,Kafka一直没能得到临幸。直到最近,有人要我尝试下这个“中间人”,看看这东西是否能满足一个项目的需求----其实是两个项目。可以想下我当时的表情。
我编译了Apache Kafka的源代码,将其连接到了Spark Streaming并尝试回答StackOverflow上的一些问题(在使用Scala的Flink中怎样使用Kafka? 和 怎样用jmxtrans见识Kafka中间人?),更不用说阅读繁多的相关文章和看视频。我对什么场景最适合用Apache Kafka有了清醒地认识。
在和Codilime里的团队开发DeepSense.io平台时,我们只用Ansible自动化部署。我们也尝试过Docker和Vagrant,都是为了简化DeepSense.io的部署。
这时就涉及到了两个需求:为了三个项目而研究Apache Kafka和Docker(包括其他工具)!很神奇,不是么?我终于发现了Docker可以让开发产品和部署变得多么简单。只有亲眼所见时,我才意识到 Docker竟能如此简化我的开发过程。现在我会把一切Docker化。得知wurstmeister/kafka和wurstmeister/zookeeper镜像时,我不可能更幸福了。运行Apache Kafka和使用Docker最终变得如此轻松愉悦。
然后我就想我应该分享这份热爱,不仅我,所有人都可以从中受益。
由于我在Mac OS X上,所以用Docker运行Apache Kafka的步骤依赖于boot2docker----一款轻量级Linux,供一些不原生支持Docker的平台,比如前面提到的Mac OS X以及Windows。
你将会用到wurstmeister/kafka和wurstmeister/zookeeper两个镜像。
你可以在后台或前台独立于镜像运行容器。视你的Unix技术而言,也就是一两个终端的事。这里就对Apache Kafka和Apache Zookeeper各使用一个终端。我会在另一篇博客中解释Apache Zookeeper的作用。
下面是用Docker运行Apache Kafka的步骤,假设你已经装好了boot2docker和docker。
➜ ~ boot2docker version Boot2Docker-cli version: v1.7.1 Git commit: 8fdc6f5 ➜ ~ docker --version Docker version 1.7.1, build 786b29d
我很喜欢homebrew,强烈推荐给Mac OS X的用户。很多程序包只需brew install一下就能用,包括docker和boot2docker。
在两个镜像上运行Kafka
1,(仅适用Mac OS X和Windows用户)执行boot2docker up在Mac OS上启动微型Linux内核。➜ ~ boot2docker up Waiting for VM and Docker daemon to start... .o Started. Writing /Users/jacek/.boot2docker/certs/boot2docker-vm/ca.pem Writing /Users/jacek/.boot2docker/certs/boot2docker-vm/cert.pem Writing /Users/jacek/.boot2docker/certs/boot2docker-vm/key.pem To connect the Docker client to the Docker daemon, please set: export DOCKER_HOST=tcp://192.168.59.104:2376 export DOCKER_CERT_PATH=/Users/jacek/.boot2docker/certs/boot2docker-vm export DOCKER_TLS_VERIFY=1
2,(仅适用Mac OS X和Windows用户)执行$(boot2docker shellinit)设置好终端,让docker知道微型Linux内核运行在哪儿(通过boot2docker)。为了设置上面的export,你必须在所有打开的运行Docker终端中重复这一步骤。如果你遇到docker命令的通信问题,记着这一步。
➜ ~ $(boot2docker shellinit) Writing /Users/jacek/.boot2docker/certs/boot2docker-vm/ca.pem Writing /Users/jacek/.boot2docker/certs/boot2docker-vm/cert.pem Writing /Users/jacek/.boot2docker/certs/boot2docker-vm/key.pem
3,执行docker ps确保为Docker配置好了终端。
➜ ~ docker ps CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
这时还没有容器运行。一旦首先启动Zookeeper的容器就会有变化,接着是Kafka。
4,在Docker Hub上创建账号并运行docker login保存证书。你不必重复通过docker pull从Docker镜像的公用中心下载镜像,把Docker Hub看作存储Docker镜像的GitHub。参考文档使用Docker Hub获得最新信息。
5,执行docker pull wurstmeister/kafka从Docker Hub下载Zookeeper镜像(可能需要几分钟)
➜ ~ docker pull wurstmeister/zookeeper Pulling repository wurstmeister/zookeeper a3075a3d32da: Download complete ... 840840289a0d: Download complete e7381f1a45cf: Download complete 5a6fc057f418: Download complete Status: Downloaded newer image for wurstmeister/zookeeper:latest
你会看到各层的哈希打印在控制台里,符合预期。
6,执行docker pull wurstmeister/kafka从Docker Hub下载Kafka镜像(可能需要几分钟)
➜ ~ docker pull wurstmeister/kafka latest: Pulling from wurstmeister/kafka 428b411c28f0: Pull complete ... 422705fe88c8: Pull complete 02bb7ca441d8: Pull complete 0f9a08061516: Pull complete 24fc32f98556: Already exists Digest: sha256:06150c136dcfe6e4fbbf37731a2119ea17a953c75902e52775b5511b3572aa1f Status: Downloaded newer image for wurstmeister/kafka:latest
7,在命令行中执行docker images验证wurstmeister/kafka和wurstmeister/zookeeper两个镜像已下载。
➜ ~ docker images REPOSITORY TAG IMAGE ID CREATED VIRTUAL SIZE wurstmeister/kafka latest 24fc32f98556 3 weeks ago 477.6 MB wurstmeister/zookeeper latest a3075a3d32da 9 months ago 451 MB
8,现在可以在一个终端里运行docker run --name zookeeper -p 2181 -t wurstmeister/zookeeper引导启动Zookeeper。如果你在Mac OS X或Windows上,记得$(boot2docker shellinit)。
➜ ~ docker run --name zookeeper -p 2181:2181 -t wurstmeister/zookeeper JMX enabled by default Using config: /opt/zookeeper-3.4.6/bin/../conf/zoo.cfg 2015-07-17 19:10:40,419 [myid:] - INFO [main:QuorumPeerConfig@103] - Reading configuration from: /opt/zookeeper-3.4.6/bin/../conf/zoo.cfg ... 2015-07-17 19:10:40,452 [myid:] - INFO [main:ZooKeeperServer@773] - maxSessionTimeout set to -1 2015-07-17 19:10:40,464 [myid:] - INFO [main:NIOServerCnxnFactory@94] - binding to port 0.0.0.0/0.0.0.0:2181
现在ZooKeeper在监听2181端口。用Docker(或者Mac OS上的Boot2Docker)的IP地址远程连接确认下。
➜ ~ telnet `boot2docker ip` 2181 Trying 192.168.59.103... Connected to 192.168.59.103. Escape character is '^]'.
9,在另一个终端里执行
docker run --name kafka -e HOST_IP=localhost -e KAFKA_ADVERTISED_PORT=9092 -e KAFKA_BROKER_ID=1 -e ZK=zk -p 9092 --link zookeeper:zk -t wurstmeister/kafka
记得$(boot2docker shellinit),如果你在Mac OS X或Windows上。
➜ ~ docker run --name kafka -e HOST_IP=localhost -e KAFKA_ADVERTISED_PORT=9092 -e KAFKA_BROKER_ID=1 -e ZK=zk -p 9092 --link zookeeper:zk -t wurstmeister/kafka [2015-07-17 19:32:35,865] INFO Verifying properties (kafka.utils.VerifiableProperties) [2015-07-17 19:32:35,891] INFO Property advertised.port is overridden to 9092 (kafka.utils.VerifiableProperties) [2015-07-17 19:32:35,891] INFO Property broker.id is overridden to 1 (kafka.utils.VerifiableProperties) ... [2015-07-17 19:32:35,894] INFO Property zookeeper.connect is overridden to 172.17.0.5:2181 (kafka.utils.VerifiableProperties) [2015-07-17 19:32:35,895] INFO Property zookeeper.connection.timeout.ms is overridden to 6000 (kafka.utils.VerifiableProperties) [2015-07-17 19:32:35,924] INFO [Kafka Server 1], starting (kafka.server.KafkaServer) [2015-07-17 19:32:35,925] INFO [Kafka Server 1], Connecting to zookeeper on 172.17.0.5:2181 (kafka.server.KafkaServer) [2015-07-17 19:32:35,934] INFO Starting ZkClient event thread. (org.I0Itec.zkclient.ZkEventThread) [2015-07-17 19:32:35,939] INFO Client environment:zookeeper.version=3.4.6-1569965, built on 02/20/2014 09:09 GMT (org.apache.zookeeper.ZooKeeper) ... [2015-07-17 19:32:36,093] INFO Awaiting socket connections on 0.0.0.0:9092. (kafka.network.Acceptor) [2015-07-17 19:32:36,095] INFO [Socket Server on Broker 1], Started (kafka.network.SocketServer) [2015-07-17 19:32:36,146] INFO Will not load MX4J, mx4j-tools.jar is not in the classpath (kafka.utils.Mx4jLoader$) [2015-07-17 19:32:36,172] INFO 1 successfully elected as leader (kafka.server.ZookeeperLeaderElector) [2015-07-17 19:32:36,253] INFO Registered broker 1 at path /brokers/ids/1 with address 61c359a3136b:9092. (kafka.utils.ZkUtils$) [2015-07-17 19:32:36,270] INFO [Kafka Server 1], started (kafka.server.KafkaServer) [2015-07-17 19:32:36,318] INFO New leader is 1 (kafka.server.ZookeeperLeaderElector$LeaderChangeListener)
现在你的电脑上运行着依托Docker的Apache Kafka,你是它的的开心用户。用docker ps查看容器状态。
➜ ~ docker ps CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES 0b34a9927004 wurstmeister/kafka "/bin/sh -c start-ka 2 minutes ago Up 2 minutes 0.0.0.0:32769->9092/tcp kafka 14fd32558b1c wurstmeister/zookeeper "/bin/sh -c '/usr/sb 4 minutes ago Up 4 minutes 22/tcp, 2888/tcp, 3888/tcp, 0.0.0.0:32768->2181/tcp zookeeper
10,要结束你的Apache Kafka旅程时,用docker stop kafka zookeeper(或docker stop $(docker ps -aq),如果运行的容器只有kafka和zookeeper)docker stop容器。
➜ ~ docker stop kafka zookeeper kafka zookeeper
之后运行docker ps会显示没有正在运行的容器:
➜ ~ docker ps CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
现在没有正在运行的容器是因为他们被关闭了,这些容器依然可以被再次启动----使用docker ps -a查看可以使用的容器。
➜ ~ docker ps -a CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES 7dde25ff7ec2 wurstmeister/kafka "/bin/sh -c start-ka 15 hours ago Exited (137) 16 seconds ago kafka b7b4b675b9c0 wurstmeister/zookeeper "/bin/sh -c '/usr/sb 16 hours ago Exited (137) 5 seconds ago zookeeper
11,最后,用boot2docker down停止boot2docker守护进程(仅对于Mac OS X和Windows用户)。
结语
利用wurstmeister/kafka和wurstmeister/zookeeper这两个镜像,不用过多修改本地的工作站环境去安装必需的包诸如Apache ZooKeeper,你就能运行Apache Kafka。除了Docker本身(和Boot2Docker,如果你恰好在Mac OS上),你不必担心其它升级软件和依赖,从而将你从花时间安装和维护你的机器和软件中解脱出来。还有,Docker镜像可以被部署到其它机器,确保一致的内部软件环境。你可以在博客下方的评论区留言,或者邮件jacek@japila.pl联系我,告诉我你对这个话题的看法。记得在推ter上关注作者@jaceklaskowski。
原文链接:Apache Kafka on Docker(翻译:Azriel 审校:魏小红)