P14

  HDFS资料整理 文档

HDFS读文件解析 下图描述了在文件读过程中,client、NameNode和DataNode三者之间是如何互动的。 1. client调用get方法得到HDFS文件系统的一个实例(Distribu

kspengjun 2011-07-26   3814   0

HDFS文件操作 经验

HDFS是一种文件系统,存储着Hadoop应用将要处理的数据,类似于普通的Unix和linux文件系统,不同的是他是实现了google的GFS文件系统的思想,是适用于大规模分布式数据处理相关应用的、可扩展的分布式文件系统。它有以下优点:

fmms 2012-04-05   44619   0
P9

  基于HDFS的Fedora的分布式存储实现研究--小论文 文档

 基于HDFS的Fedora分布式存储实现研究 师洪波1,2, 吴振新2 (1.中国科学院国家科学图书馆,北京 100190 2.中国科学院研究生院,北京 100190) 摘要:随着信息社会发展,海

li4li5li6 2012-09-11   3028   0
P5

  HADOOP-0.20.2 分布式集群配置 文档

HADOOP-0.20.2分布式集群配置 本文以安装和使用hadoop-0.20.2为例。 硬件环境 1. 虚拟机VMWare Workstation 6.5.2build 2. 三台机器均安装redhat

lxj2008 2014-01-19   3462   0

Hadoop分布式计算平台初探 经验

Hadoop是一个开发和运行处理大规模数据的软件平台,是Appach的一个用java语言实现开源软件框架,实现在大量计算机组成的集群中对海 量数据进行分布式计算。Hadoop框架中最核心设计就是:Ma

jopen 2014-12-03   24277   0
P6

  使用 Linux 和 Hadoop 进行分布式计算 文档

Only▲ 使用Linux和Hadoop进行分布式计算 发表时间:2012-4-20 Ken.Mann M.Tim.Jones 来源:ibm 关键字:hadoop linux 分布式 人们每天都依赖搜索引擎以从

wwqu1020 2012-09-13   3132   0

hadoop分布式集群搭建 经验

hadoop版本:hadoop-0.20.205.0-1.i386.rpm 下载地址:http://www.fayea.com/apache-mirror/hadoop/common/hadoop-0

openkk 2012-09-01   32361   0

hadoop2.7完全分布式安装 经验

3、/etc/profile HADOOP_PREFIX=/opt/hadoop JAVA_HOME=/opt/jdk1.7 PATH=$PATH:$JAVA_HOME/bin:$HADOOP_PREFIX/

mxw8 2015-06-21   34384   0

Hadoop2.2.0分布式安装 经验

体可参加相应教程) 1、下载 hadoop-2.2.0.tar.gz ,解压tar -xzvf  hadoop-2.2.0.tar.gz 2、进入hadoop目录下创建tmp目录和dfs/data目录、dfs/name目录

jopen 2014-09-10   10791   0

Hadoop完全分布式搭建 经验

Hadoop是Apache软件基金会旗下的一个开源分布式计算平台。以Hadoop分布式文件系统HDFSHadoop Distributed Filesystem)和MapReduce(Google

jopen 2013-12-05   56465   0

Hadoop分布式架构改进与应用 经验

Hadoop分布式架构改进与应用 Baofeng Zhang@zju 1.  背景介绍 谈到分布式系统,就不得不提到Google的三驾马车:GFS [1] ,MapReduce [2]

jopen 2012-05-31   96547   0

实现Hadoop分布式环境部署 博客

目标 配置一个分布式计算集群,让hadoop 框架能够正常的运行起来,主要有master 的namenode,jobtracker 和slave 的datanode,tasktracker. 便于之

openkk 2011-01-03   2897   0
并发  

Hadoop DistributedCache分布式缓存的使用 经验

er方法中处理目标数据时,先要去检索和匹配一个已存在的标签库,再对所处理的字段打标签。因为标签库不是很大,没必要用HBase。我的实现方法是把标签库存储成HDFS上的文件,用分布式缓存存储,这样让每个slave都能读取到这个文件。

jopen 2014-11-15   50169   0

linux分布式安装hadoop1.2 经验

三台机器,centos6.5, master、slave1、slaver2分布式安装hadoop1.2 配置环境 准备: 三台虚拟机 配置主节点: 1. 查看当前使用网卡 [root@localhost

yne7 2015-03-30   9376   0
P17

  windows上Hadoop的伪分布式配置 文档

第三章 windows上Hadoop的伪分布式配置 3.1 安装前的准备 在windows上配置Hadoop需要做一些准备,包括软件的下载,了解Hadoop运行的条件,了解Hadoop在Linux与windows平台上的不同。

louiscool 2012-04-25   614   0

hadoop分布式集群搭建 博客

hadoop版本:hadoop-0.20.205.0-1.i386.rpm 下载地址:http://www.fayea.com/apache-mirror/hadoop/common/hadoop-0

jopen 2012-09-06   2021   0
fast el   拉手  
P29

  海量数据处理的杀器 - 腾讯分布式数据仓库(TDW) 文档

1. 海量数据处理的杀器 ——腾讯分布式数据仓库(TDW)2012年7月腾讯公司 郭玮 2. Agenda 腾讯公司的海量数据处理平台 腾讯分布式数据仓库(TDW) TDW的技术点分享 TDW技术发展展望

andyxiemu 2012-08-13   1111   0

百度HDFS集群的数据压缩实现大数据的储存 博客

面对海量数据处理的需求,“大数据”这一新的概念应运而生。关于大数据的定义,目前还没有标准的说 法。 Hadoop Distributed File System,简称HDFS,是一个分布式文件系统

openkk 2012-08-12   2093   0

DataStax融资1100万,NoSQL、Hadoop 资讯

创业公司DataStax为企业提供基于开源 NoSQL 数据库 Apache Cassandra 的 Hadoop构建方案。公司近日宣布完成1100万美元B轮融资。这家位于旧金山海湾区的创业公司于20

webphp 2011-09-26   7191   0

数据而无用? 资讯

互联网的发展可以用数据来衡量,大数据被世界经济论坛称为是新的石油、新的资产类别,其革命性不亚于蒸汽机车、电网、钢铁、空调及无线电。 2005 年互联网的数据总量为 300 亿 GB,思科估计 2013

jopen 2013-08-26   16257   0
1 2 3 4 5 6 7 8 9 10