开放式创新的崛起:打造可持续发展的开源软件公司

Accel 近期举办了一个超过100位开源界的高管和思想领袖参加的全天活动,讨论的内容是利用开放技术构建伟大企业,赶上下一次浪潮。本文是从会种所学到的内容,围绕着开源软件开发的未来以及如何围绕开...
jopen 9年前    23499   

Redshift 新增12项功能

Amazon Redshift 是一种快速、完全托管的 PB 级数据仓库服务,它使得用现有商业智能工具对您的所有数据进行高效分析变得简单而实惠。您可以以每小时 0.25 USD 的价格从小规格做...
jopen 9年前    6871   

Spark 是否真的比 MapReduce 技高一筹

Apache 基金会下的 Spak 再次引爆了大数据的话题。带着比 Hadoop MapReduce 速度要快 100 倍的承诺以及更加灵活方便的 API,一些人认为这或许预示着 Hadoop ...
jopen 9年前    29104   

为什么我们选择Docker 来构建Crayon 的数据处理平台

【编者的话】随着Hadoop 成为大数据的事实标准,Hadoop的生态环境也在不断膨胀,环境搭建的复杂性,给开发和测试带来了不便。如何用Docker来降低Hadoop 开发中的复杂性,Crayo...
jopen 9年前    7343   

2016年大数据领域预测:Spark淘汰MapReduce,拯救Hadoop

2016 年大数据领域会发生什么情况?考虑到如今在深层神经网络和规范性分析方面取得的进展,你可能觉得这个问题很好回答。而实际上,来自业界的大数据预测大不相同,本文精选出了最值得关注的 33 个预...
jopen 9年前    26776   

大数据赛道上的单挑:MapReduce与Spark到底谁快?

通常人们认为Spark的性能和速度全面优于MapReduce,但最新的对决显示MapReduce在某些方面也有胜场,而且数据规模越大优势越大。
jopen 9年前    12292   

Google开源C/C++版MapReduce框架

将自己用C++开发的MapReduce框架 MapReduce for C(MR4C) 开源,此举可给Hadoop社区带来福音,因为这样用户就可以在自己的Hadoop环境中运行原生的C及C++代码了。
jopen 10年前    25467   

谷歌弃用 MapReduce, 推出替代品 Cloud Dataflow

谷歌在周三发布了 Cloud Dataflow,一个用来既可以使用流式处理又可以使用批处理模式的大数据分析服务。
jopen 10年前    8010   

MapReduce编程模型实现:Mrs 0.8 发布

Mrs是MapReduce编程模型的一个轻量级实现,但同样拥有高性能,可用于并行计算。
jopen 12年前    10040   

MapReduce单元测试框架 MRUnit 0.8.1-incubating 发布

MRUnit是由Couldera公司开发的专门针对 Hadoop中编写MapReduce单元测试的框架,基本原理是JUnit4和 EasyMock。MR就是Map和Reduce的缩写。MRUni...
jopen 13年前    7933   

MapReduce模式、算法和用例

随着 Hadoop 和大数据应用的爆发式增长,很多人正在寻找将他们已有的实现转为 MapReduce 方式的方法。不幸的是,除了《应用 MapReduce 进行数据密集的文本处理》和《Mahou...
openkk 13年前    17978   

MapReduce单元测试框架 Apache MRUnit 0.8.0-incubating

MRUnit是由Couldera公司开发的专门针对Hadoop中 编写MapReduce单元测试的框架,基本原理是JUnit4和 EasyMock。
jopen 13年前    9138   

热门问答

热门文档