用Hadoop 进行分布式并行编程(一)

基本概念与安装部署 级别:初级 曹羽中 ( caoyuz@cn.ibm.com ), 软件工程师, IBM中国开发中心 2008 年 5 月 22 日 Hadoop 是一个实现了MapReduc...
Hadoopp 6年前       0      1K    

海量文件的分布式计算处理方案

Hadoop 是Google MapReduce的一个Java实现。MapReduce是一种简化的分布式编程模式,让程序自动分布到一个由普通机器组成的超大集群上并发执行。就如 同java程序员可...
Hadoopp 6年前       0      803    

详细讲解Hadoop中的一个简单数据库HBase

HBase是 Hadoop中的一个简单数据库。它与Google的Bigtable特别相似,但也存在许多的不同之处。 数据模型 HBase数据库使用了和 Bigtable非常相似的数据模型。用户在...
Hadoopp 6年前       0      1K    

Cascading——针对Hadoop MapReduce的数据处理API

Cascading API的核心概念是管道和流。所谓管道,就是一系列处理步骤(解析、循环、过滤等等),这些步骤定义了将要进行的数据处理,而流就是带有数据源与数据接收 器(data-sink)的管...
Hadoopp 6年前       0      1K    
写博客

博客分类

热门问答

热门文档