P5

  十分钟掌握MapReduce的精髓 文档

作者的目的是讨论MapReduce是否应该继续提供“免费的午餐”,但作者在文中用比较通俗的语言对MapReduce的原理进行了讲解并给了例子,我相信这对不熟悉MapReduce的人来说是个非常不错的入门文章,所以将文章转过来并改名《十分钟掌握MapReduce的精髓》与各位云友分享,希望对大家有用。以下是原文:

wujianhai 2011-11-18   3799   0
P12

  MapReduce框架结构 文档

MapReduce框架结构Map/Reduce是一个用于大规模数据处理的分布式计算模型,它最初是由Google工程师设计并实现的,Google已经将它完整的HYPERLINK"http://labs.google.com/papers/mapreduce.html"MapReduce论文公开发布了。其中对它的定义是,Map/Reduce是一个编程模型(programmingmodel),是一个用于处理和生成大规模数据集(processingandgeneratinglargedatasets)的相关的实现。用户定义一个map函数来处理一个key/value对以生成一批中间的key/value对,再定义一个reduce函数将所有这些中间的有着相同key的values合并起来。很多现实世界中的任务都可用这个模型来表达。 Hadoop的Map/Reduce框架也是基于这个原理实现的,下面简要介绍一下Map/Reduce框架主要组成及相互的关系。

JDynamiTe 2011-03-30   7606   0

关键词

最新上传

热门文档