开源项目,开源代码,开源文档,开源新闻,开源社区

定义RPC协议 import java.io.IOException; import org.apache.hadoop.ipc.VersionedProtocol; /** * DateTime: 2014年12月28日上午9:32:12

码头工人 2014-12-29 18619 0

Hadoop 分布式/云计算/大数据

hadoop和spark集群的搭建，主要用到了hadoop2.5.2、spark1.2.0、scala2.11.4 hadoop2.5.2的安装可以参照 http://blog.csdn.ne

jopen 2014-12-25 113517 0

分布式/云计算/大数据 Spark

Hadoop启蒙还在实验室时，老师就建议看google关于大数据的三篇论文，啃了好长时间还是没完全理解。也动手搭建了Hadoop集群，运行了wordcount，带着“Hadoop会火“的指示离开了实验室。

jopen 2015-03-11 29845 0

Hadoop 分布式/云计算/大数据

Hadoop 作为一个较通用的海量数据处理平台，每次运算都会需要处理大量数据，我们会在 Hadoop 系统中对数据进行压缩处理来优化磁盘使用率，提高数据在磁盘和网络中的传输速度，从而提高系统处理数据的

hbnyb 2016-01-21 21499 0

Hadoop 分布式/云计算/大数据

来自： http://www.itweet.cn/2016/01/25/Hadoop-Disk-Planning/ 文章目录 1. 简介 2. 走向分布式 3. 存储规划 4. HDFS目录规划 4

dongpo 2016-01-27 21195 0

分布式/云计算/大数据

谁在用 Hadoop 这是个问题。在大数据背景下，Apache Hadoop 已经逐渐成为一种标签性，业界对于这一开源分布式技术的了解也在不断加深。但谁才是 Hadoop 的最大用户呢？首先想到的当然是它的“发源地”

jopen 2012-07-12 41501 1

Hadoop ci C/C++ Go HTML

P23

Hadoop任务调度器演讲人：董西成技术博客：dongxicheng.org sina微博：西成懂 2. 提纲基础知识 Hadoop调度流程 Hadoop自带调度器介绍编写自己的Hadoop调度器

gppxm 2012-10-19 6598 0

Hadoop 分布式/云计算/大数据演讲

P21

1. 云计算架构Hadoop为商业打开数据之门 2. 1Hadoop是什么？开源软件工业标准硬件IT成本降低 3. 2 2004年，Google发表论文，向全世界介绍了MapReduce。 2005年

altila 2012-06-12 745 0

Hadoop 分布式/云计算/大数据方案报告 Apache

P230

HBASE从入门到精通一、 HBase技术介绍 HBase简介 HBase – Hadoop Database，是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统，利用HBase技术可在廉价PC

ijamesbond 2015-03-17 6869 0

NoSQL数据库

apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FileSystem; import org.apache.hadoop.fs.Path;

jopen 2013-07-11 84118 0

Hadoop 分布式/云计算/大数据

Azkaban是个简单的批处理调度器，用来构建和运行Hadoop作业或其他脱机过程。项目主页： http://www.open-open.com/lib/view/home/1339233539396

openkk 2012-06-09 16216 0

Hadoop 分布式/云计算/大数据

原文见： http://blog.josedacruz.com/2013/12/09/hadoop-in-5-minutes-for-beginners/#.Uqhs3_Q6Cjt 如果你有大量的

jopen 2013-12-12 21448 0

Hadoop 分布式/云计算/大数据

HTools是一款专业的Hadoop管理工具，不管您是非专业IT人士，还是多年经验的技术人员，本工具都会为您提供优质的管理服务和轻松的操作过程，释放无谓的工作压力，提高Hadoop的管理水平。我们以最

jopen 2013-12-25 39788 0

Hadoop 分布式/云计算/大数据

le提出，主要用于搜索领域，解决海量数据的计算问题.对于业界的大数据存储及分布式处理系统来说Hadoop2提出的新MapReudce就是YARN: A framework for job scheduling

jopen 2014-11-17 47213 0

MapReduce 分布式/云计算/大数据

Sqoop（SQL-to-Hadoop）项目旨在协助 RDBMS 与 Hadoop 之间进行高效的大数据交流。用户可以在 Sqoop 的帮助下，轻松地把关系型数据库的数据导入到 Hadoop 与其相关的系统

jopen 2014-12-02 18913 0

Sqoop 分布式/云计算/大数据

Hadoop 2.x HDFS新特性 HDFS联邦 HDFS HA（要用到zookeeper等，留在后面再讲） HDFS快照回顾： HDFS两层模型 Namespace：包

jopen 2015-01-13 19497 0

Hadoop 分布式/云计算/大数据

简述：Hadoop是最著名使用最广泛的分布式大数据处理框架，它是用Java开发的。物理主机、虚拟机、虚拟主机这三个就不多说了。我们先在ubuntu里添加一个叫hadoop的用户 ‍ 1：安装jdk

jopen 2015-02-13 14404 0

Hadoop 分布式/云计算/大数据

Storm 是一个类似Hadoop MapReduce的系统，用户按照指定的接口实现一个任务，然后将这个任务递交给JStorm系统，Jstorm将这个任务跑起来，并且按7 * 24小时运行起来，一旦中间一个worker

jopen 2014-02-27 43539 0

消息系统 JStorm

Cloudbreak 是首个基于hadoop的docker service API。 Cloudbreak 建立于 Apache Ambari , Docker containers, Serf 和 dnsmasq

jopen 2014-08-24 15444 0

分布式/云计算/大数据 Cloudbreak

上建立多节点的 Hadoop 集群在上篇文章中你已经看到了在你的devbox创建一个单点Hadoop 集群是多么简单。现在我们提高门槛，在Docker上创建一个多点hadoop集群。在开始前，确保你有最新的Ambari镜像：

jopen 2014-07-01 29523 0

Docker 虚拟化

Hadoop RPC使用方法示例经验

搭建hadoop/spark集群环境经验

述说我的Hadoop成长路线经验

Hadoop 压缩实现分析经验

Hadoop平台架构经验

10个Hadoop的应用场景问答

Hadoop 任务调度器-董西成文档

云计算架构 Hadoop 文档

Hadoop之HBase从入门到精通文档

Hadoop HDFS文件操作的Java代码经验

Hadoop批处理调度器 Azkaban 经验

Hadoop五分钟入门指南经验

Hadoop集群监控工具：HTools 经验

Hadoop中MapReduce框架入门经验

Hadoop数据传输工具：Sqoop 经验

Hadoop 2.x HDFS新特性经验

Hadoop初步体验（安装与测试）经验

阿里类似Hadoop MapReduce的系统：jstorm 经验

Cloudbreak - 基于Hadoop的Docker service API 经验

在 Docker 上建立多节点的 Hadoop 集群经验

K-means Hadoop 的相关搜索

关键词

Hadoop RPC使用方法示例 经验

搭建hadoop/spark集群环境 经验

述说我的Hadoop成长路线 经验

Hadoop 压缩实现分析 经验

Hadoop平台架构 经验

10个Hadoop的应用场景 问答

Hadoop 任务调度器-董西成 文档

云计算架构 Hadoop 文档

Hadoop之HBase从入门到精通 文档

Hadoop HDFS文件操作的Java代码 经验

Hadoop批处理调度器 Azkaban 经验

Hadoop五分钟入门指南 经验

Hadoop集群监控工具：HTools 经验

Hadoop中MapReduce框架入门 经验

Hadoop数据传输工具：Sqoop 经验

Hadoop 2.x HDFS新特性 经验

Hadoop初步体验（安装与测试） 经验

阿里类似Hadoop MapReduce的系统：jstorm 经验

Cloudbreak - 基于Hadoop的Docker service API 经验

在 Docker 上建立多节点的 Hadoop 集群 经验

K-means Hadoop 的相关搜索

关键词

Hadoop RPC使用方法示例经验

搭建hadoop/spark集群环境经验

述说我的Hadoop成长路线经验

Hadoop 压缩实现分析经验

Hadoop平台架构经验

10个Hadoop的应用场景问答

Hadoop 任务调度器-董西成文档

Hadoop之HBase从入门到精通文档

Hadoop HDFS文件操作的Java代码经验

Hadoop五分钟入门指南经验

Hadoop中MapReduce框架入门经验

Hadoop 2.x HDFS新特性经验

Hadoop初步体验（安装与测试）经验

在 Docker 上建立多节点的 Hadoop 集群经验