P36

  Hadoop / MapReduce 讨论与学习 文档

Hadoop / MapReduce 讨论与学习 2. Hadoop 源起Apache Lucene 开源的高性能全文检索工具包 Apache Nutch 开源的 Web 搜索引擎 Google 三大论文 MapReduce

jphnny 2016-06-28   3381   0

MapReduce数据流 经验

图 4.4 高层 MapReduce 工作流水线 MapReduce 的输入一般来自 HDFS 中的文件,这些文件分布存储在集群内的节点上。运行一个 MapReduce 程序会在集群的许多节点甚至所有节点上运行

openkk 2012-02-16   49209   0

MapReduce + Oracle = Tablefunctions 经验

之上实现MapReduce系统。这里基于在这个博客上,显示了很好的实施tablefunctions和映射器等. 但后来我们想,为什么不经过tablefunction代码和MapReduce范例一种

jopen 2014-10-06   14418   0
P35

  PageRank 的 MapReduce 实现 文档

1. PageRank的MapReduce实现2011-09 2. PageRank算法介绍 PageRank算法的MapReduce实现 实现一个简单的搜索引擎 WordCount例程源码讲解 3.

平江夜弹 2012-08-11   690   0
Go  

下载谷歌MapReduce 博客

准备下载谷歌MapReduce资料。

bigcat76 2011-07-27   576   0
P96

  MapReduce 算法设计 文档

1. Ch.6. MapReduce 算法设计南京大学计算机科学与技术系 主讲人:黄宜华 2012年春季学期MapReduce海量数据并行处理鸣谢:本课程得到Google公司(北京) 中国大学合作部精品课程计划资助

bxunzhao 2013-05-18   999   0

MapReduce实现 - GraphLab 经验

GraphLab 是一个机器学习平台,主要是图模型方面的计算。 GraphLab 是另一种有趣的 MapReduce 抽象实现,侧重机器学习算法的并行实现。 GraphLab 中, Map 阶段定义了可以独立执行(在独立的主机上)的计算,

jopen 2012-12-13   16544   0

大数据(四) - MapReduce 经验

MapReduce适合PB级以上海量数据的离线处理 MapReduce不擅长什么 实时计算 像MySQL一样,在毫秒级或者秒级内返回结果 流式计算 MapReduce的输入数据集是静态的,不能动态变化

jopen 2016-01-20   13788   0
P35

  Hadoop及mapreduce入门 文档

Hadoop HistoryDec 2004 – Google GFS paper published July 2005 – Nutch uses MapReduce Feb 2006 – Becomes Lucene

P35

  Hadoop及Mapreduce入门 文档

Hadoop HistoryDec 2004 – Google GFS paper published July 2005 – Nutch uses MapReduce Feb 2006 – Becomes Lucene

lxz 2014-01-03   2919   0
P2

  MapReduce 编程模型 文档

1.1 MapReduce编程模型   MapReduce采用"分而治之"的思想,把对大规模数据集的操作,分发给一个主节点管理下的各个分节点共同完成,然后通过整合各个节点的中间结果,得到最终结果。简

hadooper 2013-05-30   1983   0

Python 的mapreduce 单词统计 代码段

#!/usr/bin/env python import random # 'abc..z' alphaStr = "".join(map(chr, range(97,123))) fp = open("word.txt", "w") maxIter = 100000 for i in range(maxIter): word = "" len =random.randint(1,5) for j

en9 2014-12-30   2110   0
Python  
P27

  MapReduce 技术的初步了解与学习 文档

 1. MapReduce技术的初步了解与学习  1. --包含Google MapReduce中文版 2. 摘要 3. 介绍 4. 编程模型 1. 例子 2. 类型 3. 更多的例子 4. 实现 5

lzqkean 2013-11-06   427   0
P12

  MapReduce框架结构 文档

MapReduce框架结构 2          MapReduce框架结构 Map/Reduce是一个用于大规模数据处理的分布式计算模型,它最初是由Google工程师设计并实现的,Google已经

JDynamiTe 2011-03-30   7606   0

快速学习mongodb的mapreduce例子 经验

map和reduce是十分有用的操作,特别是在NOSQL中.本文简单小结下 在mongodb中对mapreduce的操作,以及在JAVA中如何操作. 1 启动mongodb mongo启动即可

fmms 2012-02-17   50599   0
P8

  自己整理的Hadoop Hive MapReduce 文档

Hadoop 是2005 Google MapReduce的一个Java实现。MapReduce是一种简化的分布式编程模式,让程序自动分布到一个由普通机器组成的超大集群上并发执行。就如 同java程序员可以不考虑内存泄露一样,

xfj3526 2012-06-13   5194   0

使用mapreduce计算环比的实例 经验

html 最近做了一个小的mapreduce程序,主要目的是计算环比值最高的前5名,本来打算使用spark计算,可是本人目前spark还只是简单看了下,因此就先改用mapreduce计算了,今天和大家分享

Smith 2016-02-21   16578   0

Hadoop入门之HDFS与MapReduce 经验

Hadoop的核心就是HDFS与MapReduce 1. HDFS master/slave : Namenode,Datanode Namenode:Namenode执行文件系统

fmms 2012-01-06   60053   0

MapReduce工作机制总结 经验

总结从MapReduce程序中的JobClient.runJob(conf)开始,给出了MapReduce执行的流程图(如下),并分析了流程图中的四个核心实体,结合实际代码介绍了MapReduce执行的详细流程。

jopen 2013-12-06   25604   0

MapReduce架构设计 经验

MapReduce采用Master/Slave的架构,其架构图如下: 它主要有以下4个部分组成: 1)Client 2)JobTracker JobTracke负责资源监控和作业调度。JobTracker

jopen 2013-06-11   45698   0
1 2 3 4 5 6 7 8 9 10