RedHat开源其Hadoop存储系统
作为大数据+混合云业务战略的一部分,Red Hat 没有选择推出自己的 hadoop 商业版本或者收购一家 Hadoop 发行厂商,而是推出了首个 Hadoop HDFS 文件存储系统的开源替代产品。
Red Hat 本周三宣布开源其 Red Hat Storage Hadoop 插件,作为 HDFS 的替代产品。RedHat Storage hadoop 插件基于 Gluster 文件系统——Red Hat 于 2011 年以 1.36 亿美元收购了 Gluster,目前已经将 Gluster 的技术整合到了 Red hat 的存储服务器产品(RHSS)中。Red Hat 计划在今年某个时候将该插件发布到 Apache 软件基金会。
Red Hat 在新闻发布会上表示:
Red Hat 存储产品将企业级功能带到了大数据环境,例如异地备份、高可用性、POSIX 合规、灾备和管理等,而这些不以牺牲 API 兼容性和数据归属为代价。客户目前有了一个统一的可扩展存储软件平台来管理部署在不同物理、虚拟、公共或者混合云资源中的文件和对象。
由于实现了完全的分布式,Red Hat 的文件系统能够取代 Hadoop 集群中负责数据追踪的 NameNode,从而消除其性能瓶颈和单点失败问题。(不过 Hadoop 社区已经通过 Apache hadoop 2.0已经改善了 NameNode,而 非死book 的工程师则开发出了替代技术 AvatarNode)Red Hat 还将其存储和虚拟化技术进行组合,同时使用这两者的用户将拥有一个存储的虚拟池,而计算资源能驻留在相同的物理基础架构上。
除了 Red hat,如今很多公司都试图解决 HDFS 存在的问题,提高其在大型企业或者互联网公司中的可用性。EMC、NetApp 等公司都提出了自己的替代方案。Quantcast 甚至开发并开源了自己的 HDFS 版本——Quantcast File System。Hadoop 的未来取决于能否成功开拓大型企业市场,而 HDFS 的替代技术目前是企业应用的首选,除非 Apache hadoop 能够快速跟上。
对于 Red Hat 来说,开源 Hadoop 存储系统只是混合云战略的一部分,Red Hat 表示希望在 Hadoop 上的努力能够推动其更宏大的云计算战略——让客户能够在混合云计算的大数据环境中运行应用,横跨包括 OpenStack 和亚马逊 AWS 这样的私有云或公用云环境。