0推荐
28K 浏览

Ubuntu编译Hadoop编码异常总结

Ubuntu编译Hadoop编码异常总结
0推荐
32K 浏览

Hadoop面试题,看看你能答对多少?答案在后面

大数据技术Hadoop面试题,看看你能答对多少?答案在后面
0推荐
22K 浏览

Oozie:Hadoop工作调度工具

在Hadoop中执行的任务有时候需要把多个Map/Reduce作业连接到一起,这样才能够达到目的。在Hadoop生态圈中,有一个相对比较新的组件叫做Oozie,它让我们可以把多个Map/Redu...
0推荐
108K 浏览

hadoop2.5.1安装到虚拟机

hadoop2.5.1安装到虚拟机
0推荐
24K 浏览

Hadoop:分布式计算平台初探

Hadoop是一个开发和运行处理大规模数据的软件平台,是Appach的一个用java语言实现开源软件框架,实现在大量计算机组成的集群中对海 量数据进行分布式计算。Hadoop框架中最核心设计就是...
0推荐
191K 浏览

大数据技术大合集:Hadoop家族、Cloudera系列、spark、storm

大数据我们都知道hadoop,可是还会各种各样的技术进入我们的视野:Spark,Storm,impala,让我们都反映不过来。为了能够更好 的架构大数据项目,这里整理一下,供技术人员,项目经理,...
0推荐
27K 浏览

Hadoop2.5.0完全分布式配置(1主3从)

Hadoop2.5.0完全分布式配置(1主3从)
0推荐
13K 浏览

Hadoop MapReduce下一代 - 命令行Mini集群

使用命令行接口运行Mini集群,用户可以使用一个简单的命令启动或者停止一个单节点的Hadoop集群,不需要设置任何环境变量和管理配置文件。这个CLI Mini集群将会启动Yarn/MapRedu...
0推荐
17K 浏览

Hadoop的使用命令

Hadoop的使用命令
0推荐
43K 浏览

Hadoop生态系统学习路线

主要介绍Hadoop家族产品,常用的项目包括Hadoop, Hive, Pig, HBase, Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa,新增...
0推荐
24K 浏览

Hadoop配置文件参数说明

配置hadoop,主要是配置core-site.xml,hdfs-site.xml,mapred-site.xml三个配置文件,默认下来,这些配置文件都是空的,所以很难知道这些配置文件有哪些配置...
0推荐
14K 浏览

Hadoop 的数据处理解决方案:Cascalog

Cascalog 是 Hadoop 上的数据处理解决方案,无需 hassle。
jopen 10年前   
0推荐
55K 浏览

hadoop压缩与解压

一 般来说,计算机处理的数据都存在一些冗余度,同时数据中间,尤其是相邻数据间存在着相关性,所以可以通过一些有别于原始编码的特殊编码方式来保存数据, 使数据占用的存储空间比较小,这个过程一般叫压缩...
0推荐
10K 浏览

Hadoop集群搭建(-v1.2.1)

Hadoop集群搭建(-v1.2.1)
0推荐
101K 浏览

Spark与Hadoop的结合

Spark可以直接对HDFS进行数据的读写,同样支持Spark on YARN。Spark可以与MapReduce运行于同集群中,共享存储资源与计算,数据仓库Shark实现上借用Hive...
0推荐
27K 浏览

什么是Hadoop即服务(Hadoop-as-a-Service)

两周前的VMworld 2014大会上,EMC演示了一段基于EMC Hybrid Cloud混合云架构之上的HaaS(Hadoop-as-a-Service,Hadoop即服务)和Vir...
0推荐
18K 浏览

hadoop增加新节点实践

之前已经有了namenode和datanode1,现在要新增节点datanode2
0推荐
32K 浏览

Hadoop伪分布配置与基于Eclipse开发环境搭建

Hadoop伪分布配置与基于Eclipse开发环境搭建
0推荐
28K 浏览

Hadoop集群 CentOS安装配置

CentOS是一个基于Red Hat 企业级 Linux 提供的可自由使用的源代码企业级的 Linux 发行版本。每个版本的 CentOS 都会获得七年的支持(通过安全更新方式)。新版本的 Ce...
0推荐
87K 浏览

基于Nutch+Hadoop+Hbase+ElasticSearch的网络爬虫及搜索引擎

网络爬虫架构在Nutch+Hadoop之上,是一个典型的分布式离线批量处理架构,有非常优异的吞吐量和抓取性能并提供了大量的配置定制选项。由于网络爬虫只负责网络资源的抓取,所以,需要一个分布式搜索...
jopen 10年前   
1 2 3 4 5 6 7 8 9 10

经验分享,提升职场影响力

投稿

热门问答

    热门文档