0推荐
8K 浏览

Hadoop2.2.0单节点安装和配置环境图文详解

摘要:最近也是刚刚入门hadoop,配置环境就折腾了很久,在网上也查看了给位大神的帖子,从中也学到 了很多东西,但是很多都是比较杂,在这里我就贴出我配置的一些心得,望各位指教。
0推荐
19K 浏览

Hadoop主要子项目介绍(Pig Zookeeper Hbase Hive Sqoop Avro Chukwa Cassandra )

现在Hadoop已经发展成为包含多个子项目的集合。虽然其核心内容是MapReduce和Hadoop分布式文件系统(HDFS),但Hadoop下的Common、Avro、Chukwa、Hive、H...
0推荐
24K 浏览

彻底厘清真实世界中的分布式系统

编者的话:本文从一个实践者的角度,首先介绍了分布式系统的一些理论结果,例如 FLP 不可能性和 CAP 定理等;然后介绍了构建实际分布式系统最重要的一个原则:端到端;最后讨论了实际系统经常用到的协调服务。
0推荐
22K 浏览

zookeeper C API指南

zookeeper C API指南:  由于所接手的项目里面用到了zookeeper,所以就收集了zookeeper相关的知识: Zookeeper ...
0推荐
19K 浏览

hadoop再次集群搭建(5)-CDH Install

Cloudera Manager 5.3 提供了单用户模式,从而满足了对些类环境的要求。在单用户模式中,Cloudera Manager Agent 和所有由 Cloudera Manager ...
0推荐
14K 浏览

hadoop再次集群搭建(4)-Cloudera Manager Installation

Cloudera Manager在集群已经实现ssh免秘钥登录,能够访问网络资源和本地资源的情况下,可以自动安装和配置CDH(Cloudera distributed hadoop),以及...
0推荐
9K 浏览

hadoop再次集群搭建(3)-如何选择相应的hadoop版本

1.x版本,比较经典,使用者很多。2.x版本,和1.x并不兼容。2.x完全推翻了1.x的代码,重新编写的。内部思想有借鉴。
0推荐
17K 浏览

hadoop再次集群搭建(2)-配置免秘钥ssh登录

第一种级别(基于口令的安全验证)只要你知道自己帐号和口令,就可以登录到远程主机。所有传输的数据都会被加密,但是不能保证你正在连接的服务器就是你想连接的服务器。可能会有别的服务器在冒充真正的服务器...
0推荐
9K 浏览

hadoop再次集群搭建(1)-安装系统

从8月份到现在12月份,中间有四个月的时间没有学习hadoop系统了。其实适应新的环境,到现在一切尘埃落定,就应该静下心来,好好学习一下hadoop以及我之前很想学习的mahout。个人对算法比...
0推荐
11K 浏览

hadoop集群ambari搭建(2)之制作hadoop本地源

准备好源资源服务器,我使用之前的一台node4,配置都是1GB内存20GB存储 集群最好的安装方式一定是通过本地源的,如果是公共源,那么网络将会严重影响我们的安装进度。所以制作本地源是每一...
0推荐
61K 浏览

hadoop集群ambari搭建(1)之ambari-server安装

Apache Ambari是一种基于Web的工具,支持Apache Hadoop集群的供应、管理和监控。Ambari目前已支持大多数Hadoop组件,包括HDFS、MapReduce、Hive、...
0推荐
18K 浏览

MapReduce中combine、partition、shuffle的作用是什么

Mapreduce在hadoop中是一个比较难以的概念。下面需要用心看,然后自己就能总结出来了。
0推荐
12K 浏览

MapReduce 图解流程

MapReduce 图解流程
0推荐
39K 浏览

MapReduce 图解流程超详细解答(1)-【map阶段】

在MapReduce中,一个YARN 应用被称作一个job, MapReduce 框架提供的应用,master的一个实现被称作MRAppMaster
0推荐
10K 浏览

MapReduce 图解流程超详细解答(2)-【map阶段】

MapReduce 图解流程超详细解答(2)-【map阶段】
0推荐
7K 浏览

Hadoop构架概览

hadoop是一个开源的软件框架,是一个利用商业硬件处理和存储大型数据的软件。从下到上主要有五个主要的组成部分:
0推荐
9K 浏览

Zookeeper简单概念介绍

过去,每个应用都是一个CPU,一个主机上的单一系统。然而今天,随着大数据和云计算时代的到来,任何相互独立的程序都可以运行在多个计算机上。然而面临的问题是,协调这些集群的系统比在单一主机上要复杂的...
0推荐
7K 浏览

提高hadoop的mapreduce job效率笔记—–修改mapper和reducer数量

hadoop 的mapreduce 的作业在运行过程中常常碰到一些这样的情况:  
0推荐
9K 浏览

Spark Streaming使用Kafka保证数据零丢失

源文件放在github,随着理解的深入,不断更新,如有谬误之处,欢迎指正。 原文链接https://github.com/jacksu/utils4s/blob/master/spark-kno...
0推荐
20K 浏览

HBase之一【HBase基础】HBase技术介绍

HBase是Google Bigtable的开源实现,类似Google Bigtable利用GFS作为其文件存储系统,HBase利用Hadoop HDFS作为其文件存储系统;Google运行Ma...
1 2 3 4 5 6 7 8 9 10

经验分享,提升职场影响力

投稿

热门问答

    热门文档