登录
注册
首页
项目
经验
代码
文库
问答
博客
资讯
分布式/云计算/大数据
(共
1277
篇经验)
0
推荐
8K
浏览
Hadoop2.2.0单节点安装和配置环境图文详解
摘要:最近也是刚刚入门hadoop,配置环境就折腾了很久,在网上也查看了给位大神的帖子,从中也学到 了很多东西,但是很多都是比较杂,在这里我就贴出我配置的一些心得,望各位指教。
jopen
9年前
分布式/云计算/大数据
0
推荐
19K
浏览
Hadoop主要子项目介绍(Pig Zookeeper Hbase Hive Sqoop Avro Chukwa Cassandra )
现在Hadoop已经发展成为包含多个子项目的集合。虽然其核心内容是MapReduce和Hadoop分布式文件系统(HDFS),但Hadoop下的Common、Avro、Chukwa、Hive、H...
jopen
9年前
分布式/云计算/大数据
0
推荐
24K
浏览
彻底厘清真实世界中的分布式系统
编者的话:本文从一个实践者的角度,首先介绍了分布式系统的一些理论结果,例如 FLP 不可能性和 CAP 定理等;然后介绍了构建实际分布式系统最重要的一个原则:端到端;最后讨论了实际系统经常用到的协调服务。
jopen
9年前
分布式系统
分布式/云计算/大数据
0
推荐
22K
浏览
zookeeper C API指南
zookeeper C API指南: 由于所接手的项目里面用到了zookeeper,所以就收集了zookeeper相关的知识: Zookeeper ...
jopen
9年前
分布式/云计算/大数据
0
推荐
19K
浏览
hadoop再次集群搭建(5)-CDH Install
Cloudera Manager 5.3 提供了单用户模式,从而满足了对些类环境的要求。在单用户模式中,Cloudera Manager Agent 和所有由 Cloudera Manager ...
jopen
9年前
分布式/云计算/大数据
0
推荐
14K
浏览
hadoop再次集群搭建(4)-Cloudera Manager Installation
Cloudera Manager在集群已经实现ssh免秘钥登录,能够访问网络资源和本地资源的情况下,可以自动安装和配置CDH(Cloudera distributed hadoop),以及...
jopen
9年前
分布式/云计算/大数据
0
推荐
9K
浏览
hadoop再次集群搭建(3)-如何选择相应的hadoop版本
1.x版本,比较经典,使用者很多。2.x版本,和1.x并不兼容。2.x完全推翻了1.x的代码,重新编写的。内部思想有借鉴。
jopen
9年前
分布式/云计算/大数据
0
推荐
17K
浏览
hadoop再次集群搭建(2)-配置免秘钥ssh登录
第一种级别(基于口令的安全验证)只要你知道自己帐号和口令,就可以登录到远程主机。所有传输的数据都会被加密,但是不能保证你正在连接的服务器就是你想连接的服务器。可能会有别的服务器在冒充真正的服务器...
jopen
9年前
分布式/云计算/大数据
0
推荐
9K
浏览
hadoop再次集群搭建(1)-安装系统
从8月份到现在12月份,中间有四个月的时间没有学习hadoop系统了。其实适应新的环境,到现在一切尘埃落定,就应该静下心来,好好学习一下hadoop以及我之前很想学习的mahout。个人对算法比...
jopen
9年前
分布式/云计算/大数据
0
推荐
11K
浏览
hadoop集群ambari搭建(2)之制作hadoop本地源
准备好源资源服务器,我使用之前的一台node4,配置都是1GB内存20GB存储 集群最好的安装方式一定是通过本地源的,如果是公共源,那么网络将会严重影响我们的安装进度。所以制作本地源是每一...
jopen
9年前
分布式/云计算/大数据
0
推荐
61K
浏览
hadoop集群ambari搭建(1)之ambari-server安装
Apache Ambari是一种基于Web的工具,支持Apache Hadoop集群的供应、管理和监控。Ambari目前已支持大多数Hadoop组件,包括HDFS、MapReduce、Hive、...
jopen
9年前
分布式/云计算/大数据
0
推荐
18K
浏览
MapReduce中combine、partition、shuffle的作用是什么
Mapreduce在hadoop中是一个比较难以的概念。下面需要用心看,然后自己就能总结出来了。
jopen
9年前
分布式/云计算/大数据
0
推荐
12K
浏览
MapReduce 图解流程
MapReduce 图解流程
jopen
9年前
分布式/云计算/大数据
0
推荐
39K
浏览
MapReduce 图解流程超详细解答(1)-【map阶段】
在MapReduce中,一个YARN 应用被称作一个job, MapReduce 框架提供的应用,master的一个实现被称作MRAppMaster
jopen
9年前
分布式/云计算/大数据
0
推荐
10K
浏览
MapReduce 图解流程超详细解答(2)-【map阶段】
MapReduce 图解流程超详细解答(2)-【map阶段】
jopen
9年前
分布式/云计算/大数据
0
推荐
7K
浏览
Hadoop构架概览
hadoop是一个开源的软件框架,是一个利用商业硬件处理和存储大型数据的软件。从下到上主要有五个主要的组成部分:
jopen
9年前
分布式/云计算/大数据
0
推荐
9K
浏览
Zookeeper简单概念介绍
过去,每个应用都是一个CPU,一个主机上的单一系统。然而今天,随着大数据和云计算时代的到来,任何相互独立的程序都可以运行在多个计算机上。然而面临的问题是,协调这些集群的系统比在单一主机上要复杂的...
jopen
9年前
分布式/云计算/大数据
0
推荐
7K
浏览
提高hadoop的mapreduce job效率笔记—–修改mapper和reducer数量
hadoop 的mapreduce 的作业在运行过程中常常碰到一些这样的情况:
jopen
9年前
Hadoop
分布式/云计算/大数据
0
推荐
9K
浏览
Spark Streaming使用Kafka保证数据零丢失
源文件放在github,随着理解的深入,不断更新,如有谬误之处,欢迎指正。 原文链接https://github.com/jacksu/utils4s/blob/master/spark-kno...
jopen
9年前
Kafka
Spark Streaming
分布式/云计算/大数据
0
推荐
20K
浏览
HBase之一【HBase基础】HBase技术介绍
HBase是Google Bigtable的开源实现,类似Google Bigtable利用GFS作为其文件存储系统,HBase利用Hadoop HDFS作为其文件存储系统;Google运行Ma...
jopen
9年前
分布式/云计算/大数据
1
2
3
4
5
6
7
8
9
10
经验分享,提升职场影响力
投稿
热门问答
热门文档