Hadoop分布式文件系统:结构与设计

1. 介绍 Hadoop 分布式文件系统 (HDFS)是一个设计为用在普通硬件设备上的分布式文件系统。它与现有的分布式文件系统有很多近似的地方,但又和这些文件系统有很明显的不同。HDFS 是高容...
Hadoopp 6年前       0      1K    

Hadoop k-means 算法实现

经过昨天的准备工作,今天基本就可以编写整个k-means算法程序了。今天编写的时候遇到了一个问题,是combine操作时遇到的问题。除了这个问题基本都按照原来的思路进行。先说下我的思路吧。 准备...
Hadoopp 6年前       0      6K    

Hadoop编程入门

原文地址: http://blog.csdn.net/calvinxiu/archive/2007/02/09/1506112.aspx Hadoop 是Google MapReduce 的 一...
Hadoopp 6年前       0      1K    

Nutch Hadoop 教程

怎样安装Nutch和 Hadoop 搜寻网页和邮件列表,似乎很少有关于如何使用Hadoop (曾经的DNFS)分布式文件系统( HDFS )和MapReduce来安装Nutch的文章 。 本教程...
Hadoopp 6年前       0      7K    

用Hadoop进行分布式并行编程(二)

程序实例与分析 Hadoop 是一个实现了MapReduce 计算模型的开源分布式并行编程框架,借助于Hadoop, 程序员可以轻松地编写分布式并行程序,将其运行于计算机集群上,完成海量数据的计...
Hadoopp 6年前       0      2K    

Map Reduce - the Free Lunch is not over?

微软著名的C++大师 Herb Sutter在2005年初的时候曾经写过一篇重量级的文章:”The Free Lunch Is Over: A Fundamental Turn Toward C...
Hadoopp 6年前       0      1K    

Hadoop 0.20的配置过程和配置文件(分布式)

在安装Fedora 11的两台机器上的目录结构一致,分别安装JRE 6 Update 14,下载hadoop 0.20后解压放在目录/home/hadoop/下。hadoop包解压以后的路径名字...
Hadoopp 6年前       0      1K    

雅虎架构师谈MapReduce和Hadoop的未来

作者 Scott Delap 译者 Terry Hadoop 是一个开源的分布式计算平台,它主要由MapReduce的算法执行和一个分布式 的文件系统等两部分组成。InfoQ曾经 刊登过 一 篇...
Hadoopp 6年前       0      840    
写博客

博客分类

热门问答

热门文档