基于Java的现成容器——第一部分

jopen 9年前

Java 语言长期占据编程语言前三甲的位置,其受欢迎程度与重要性不言而喻。在容器化技术大潮中,Java 可扬容器化之长,避自身“臃肿”之短,取得更高成就。本文选择了5个有代表性的 Java 镜像进行了介绍,并指出了其现存的一些问题和解决方案,供相关人员参考。

尽管 Java 看起来不是很“时髦”,但仍是一门在移动市场、开源界及企业中占据主导地位的非常受欢迎的重要的语言。举个例子,你可知道在 Apache 软件基金会中63%的项目是用 Java 写的么?

幸运的是,在容器技术发展进程中,Java 开发人员并未被冷落。本文将着重介绍五个(译注:原文误写为“四个”)流行的基于 Java 的 Docker 镜像与配置,以及他们如何能帮助你的团队更有效地工作。

STASH

Stash 是个 Git 代码管理和协作工具。Stash 允许将部署节点集群化,从而减少活动主机的停机时间,且不会对每个添加的节点造成性能影响。Stash 还集成了 JIRA(同一公司出品)的可追溯能力,并为团队提供协作工具,具有类似这样的功能:当一个 pull 请求处于打开状态时,代码被修改将触发警报。

细节

如果你想将 Git 远程主机从一个 Stash 实例迁移到另一个 Stash 实例,请注意虽然可以把仓库复制过去, pull 请求却是无法被复制过去的。你也不能在实例间迁移。不过,Stash 的开发团队会在将来添加这些功能

在生成 JIRA 数据库结构时,请注意 JIRA 6.1 EAP 3包含了重大修改,可能会造成插件停止工作。

Stash 可以限制对重要代码分支的写权限,防止新成员误操作。Stash 允许开发人员将代码提交到自己的服务器端仓库上,然后由项目管理者审核并合并到主项目仓库中。

在 Stash 中开始一个新项目时,项目管理者应从一个全新的仓库入手:
ssh user@host  git init --bare /path/to/repo.git 

所有其他成员需要通过 SSH 进入这个仓库,并将其复制到服务器的另一个地方。Stash 称之为“分流流程”(Forking Workflow),这对于来自 SVN 背景的人有点不同寻常。

TOMCAT

Tomcat 是个实现了 Oracle 的 Java ServletJSP 规范的开源 Web 服务器及 Servlet 容器。它提供了一个标准的 HTTP 环境用于运行代码。在最简配置时,Tomcat 运行于单一的系统进程中。在旧机器上工作的开发人员通过容器安装 Tomcat 将不需要完整的虚拟机环境,从而腾出资源。

细节

对运行 Linux 虚拟机的用户而言,在 Docker 容器中运行 Tomcat 的性能可能会非常差,容器的启动速度很慢或非常卡。

如果宿主系统是 Linux,可以使用熵收集守护进程(Entropy Gathering Daemon,简称EDG)来解决这个问题。如果是使用 Boot2Docker,由于 Boot2Docker 的 Tiny Core Linux 扩展中没有 EGD,这个问题将尤为突出。将宿主的/dev/urandom装载成容器的/dev/random可作为临时解决方法

如果在 Docker 中运行 Tomcat 时,虚拟机也在经历低熵,VirtualBox 提供了一些方案来提高虚拟机的熵

APACHE HADOOP

Apache Hadoop 是个用于将大数据集分布到大量计算机中的开源框架。Hadoop 被设计成可以从一台主机扩展到数万台。Hadoop 不依赖硬件来达成容错,可在应用层面处理失败。Hadoop 框架由四个模块组成:Hadoop Common、Hadoop 分布式文件系统(HDFS)、Hadoop YARN 及 Hadoop MapReduce。此外,还有一些 Hadoop 相关的项目,包括 ZooKeeperSpark

细节

如果你试图创建多节点集群用于在 Docker 中运行 Hadoop,你可能会碰到一些麻烦。容器间网络可通过 Weave 或 SequenceIQ 的新项目 Cloudbreak 来构建。Cloudbreak 可以很容易地在不同的云供应商(比如 AWS)上创建 Hadoop 集群。

用户还遇到过在 Hadoop 中运行 pyspark(Python 中使用的一个Spark编程模型)的困难。尝试以非 root 用户保存数据帧(dataframe)会失败。重置$SPARK_USER为 root 也无事于补,因为 spark 子节点都是作为 root 运行的。如果你的项目不需要权限系统,可使用用户邮件列表的这个方式来解决。

MAVEN

Apache Maven 是个围绕“项目对象模型”(Project Object Model,简称 POM)概念的软件项目管理工具。Maven 据此从一个中央信息源来管理项目的构建、文档或报告。Maven 还提供了开发期工具,提供项目的邮件列表、代码控制器的变更日志、依赖列表或单元测试报告。

细节

在运行 Maven 的 Docker 插件时,有个错误:如果用户没有指定命令,一个空的CMD会被输出。对于那些想让容器继承父容器的信息的用户而言,会很受挫。使用官方 Docker 镜像可缓解这些问题。

如果你的服务器运行着 Jenkins,用于创建发布版或快照的设置选项在处理mvn命令的 Docker 参数时很快会变成一个麻烦。Jenkins 的 Maven 发布插件会自动配置pom.xml并部署快照。

GLASSFISH

Glassfish 是个开源应用服务器,支持 EJB、JPA、JSF、JMI、JSP 等等。Glassfish 让开发人员能够创建可扩展、可移植并可与传统技术整合的应用。用户可以安装附加组件以访问其他服务。

Glassfish 在 Docker Hub 中为想尝试新功能的开发人员提供了两个额外镜像:Nightly 和 Ozark。Ozark 包含了运行 Glassfight 4.1 的 MVC 1.0,用于支持 Java EE 8。

细节

GlassFish 目前存在一个涉及域受损的问题。如果用户删除glassfish/domain/domains目录就会出错。试图这么做后,文件会像被锁定了一样无法被删除,即便是在容器中重新安装一份全新的 GlassFish 4.1 也无济于事。已经有些解决这一问题的方案被公布出来。最常见的是 Github上这一问题的解决方法:将无法被删除的结构上移一层,然后删除它。

结语

本文中,我们介绍了这五个镜像:
  • Stash 为开发团队提供了代码管理、对等审核以及流线型工作流来管理 Git 仓库。
  • Tomcat 提供了一个轻量的 HTTP 环境来编译代码,节约了运行多个虚拟机实例所需的系统资源。
  • Hadoop 是一个很容易在应用的所有实例中分布处理大量数据的框架。
  • Maven 通过自动化处理应用的所有实例来管理项目构建过程。
  • Glassfish 允许开发人员使用 Java EE,并与传统应用整合。

这些是 Docker Hub 上 Java 应用和 DevOps 工具的很好示例,你可将其与 Docker 联合来提升工作流程、项目管道以及项目的可扩展性。

原文链接:Ready-made Java-based Containers, Part One(翻译:梁晓勇

来自:http://dockone.io/article/713