Hadoop MapReduceV2(Yarn) 框架 经验

Hadoop MapReduceV2(Yarn) 框架简介 原 Hadoop MapReduce 框架的问题 对于业界的大数据存储及分布式处理系统来说,Hadoop 是耳熟能详的卓越开源分布式文件存储及处理框架,对于

jopen 2014-09-11   22474   0

hadoop2.2.0安装笔记 经验

1.122  hadoop/hadoop VM  192.168.1.123 DataNode1 192.168.1.124 datanode1/datanode1 hadoop/hadoop

jopen 2014-08-27   11579   0

利用 Spring Boot 在 Docker 中运行 Hadoop 经验

过程。本文介绍了如何利用Spring Boot在Docker中运行Hadoop任务。 简介 越来越多的应用都开始使用Hadoop框架。而开发者在使用过程中也遇到一些挑战,比如使用诸如Docker之

jopen 2015-05-09   53777   0
Docker  
P4

  告诉你hadoop是什么 文档

【图解】告诉你Hadoop是什么         Hadoop是一种分析和处理大数据的软件平台,是Appach的一个用Java语言所实现的开源软件的加框,在大量计算机组成的集群当中实现了对于海量的数据进行的分布式计算。

wyc08st 2016-04-30   602   0
P12

  Hadoop 0.20.0 源码流程分析 文档

Hadoop源码以及流程解析 整体结构 DN: Configuration,JobClient,JobConf Master:JobTracker,JobInProgress,TaskInProgress

sweetbaybe 2012-12-24   2501   0
P19

  hadoop2.1.0编译安装教程 文档

hadoop2.1.0编译安装教程 http://blog.csdn.net/linshao_andylin/article/details/12307747  由于现在hadoop2.0还处于be

nw37 2015-01-08   509   0
P11

  Hadoop 源码阅读总结 文档

还是分布策略 可能出现一个DN上两个相同的Block么. MapReduce 命令行运行 bin/hadoop jar jarFile [mainClass] args... 设置JVM启动参数,将lib

bluesky666 2015-05-05   1964   0
P27

  Hadoop HDFS 实现原理与应用介绍 文档

百度系统部HDFS实现原理与应用介绍lixiangna@baidu.com 2. 主要内容应用背景 Hadoop简介 HDFS设计目标 HDFS系统结构 HDFS实现原理 典型实例 3. 应用背景需求 每天上TB的日志需要存储备份

cablist 2012-11-12   13153   0
P31

  内存计算Spark和 SQL on Hadoop 文档

1. 内存计算Spark和 SQL on Hadoop 黄永卿 解决方案中心 2. 目录1内存计算Spark介绍2Spark核心要点3SQL on Hadoop技术比较43+1大数据分析方案介绍 3.

pnx8 2014-08-17   756   0
P11

  Apache Hadoop入门第一步 文档

Apache Hadoop入门(一) 官方网站http://hadoop.apache.org/ 1 Apache Hadoop概述 Apache Hadoop项目开发可靠的、可扩展的(Scalable)、分布式计算的开源软件。

paradoxlee00 2012-04-11   5446   0
P14

  Hadoop 集群搭建笔记 文档

超人Hadoop网络学习社区—http://bbs.superwu.cn|吴超.沉思录 第4章:Hadoop集群 4.1.分布式集群系统安装 伪分布模式安装比较简单,集群模式是在伪分布模式基础上进行修改的,所以伪分布模式安装必须搞定。

beat_it 2013-11-16   2072   0
P17

  Hadoop1.x以及2.x安装 文档

http://blog.fens.me/hadoop-maven-eclipse/ 阅读导航 1.Hadoop-1.2.1的安装 2.Hadoop-2.6.0的安装 1 Hadoop-1.2.1的安装 1) 伪分布式的安装

小牛牛 2015-03-23   2407   0
P5

  HADOOP-0.20.2 分布式集群配置 文档

HADOOP-0.20.2分布式集群配置 本文以安装和使用hadoop-0.20.2为例。 硬件环境 1. 虚拟机VMWare Workstation 6.5.2build 2. 三台机器均安装redhat

lxj2008 2014-01-19   3462   0
P12

  用Linux和Apache Hadoop进行云计算 文档

用 Linux 和 Apache Hadoop 进行云计算 用 Linux 和 Apache Hadoop 进行云计算 2010-06-21 15:12 |  364次阅读 |  【已有0条评论】发表评论

caoyu152152 2011-07-11   583   0
P

Hadoop 1.0 权威API参考v1.0 文档

Hadoop 是一个分布式系统基础架构,由Apache基金会开发。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力高速运算和存储。Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有着高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上。而且它提供高传输率(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。HDFS放宽了(relax)POSIX的要求(requirements)这样可以流的形式访问(streaming access)文件系统中的数据。

kingrom 2013-07-28   2713   0

8个值得关注的SQL-on-Hadoop框架 资讯

数据的操作语言是SQL,因此很多工具的开发目标自然就是能够在Hadoop上使用SQL。这些工具有些只是在MapReduce之上做了简单的包装,有些则是在HDFS之上实现了完整的数据仓库,而有些则介于这两者之间。这样的工具有很多,来自于

jopen 2014-07-01   22905   0
Hadoop  

超越 Hadoop,Luigi 打通云端大数据管道 资讯

库的大数据流水线处理服务,不论是否使用Hadoop,用户都可以用Luigi管理复杂的大数据工作流。 Mortar公司最初的产品是提供一个编写和启动Hadoop任务的简单框架,运行在亚马逊弹性MapReduce云服务上。2012

jopen 2014-10-14   8176   0
Hadoop  

基于Docker快速搭建多节点Hadoop集群 资讯

一. 项目简介 GitHub地址: https://github.com/kiwenlau/hadoop-cluster-docker 博客地址: http://www.cnblogs.com/kiwenlau/p/4524607

jopen 2015-05-24   18525   0
Docker  

SOA在新兴的Hadoop世界扮演的角色 资讯

新兴且流行的数据即平台(Data-as-a-platform)Hadoop与一定程度上失宠的SOA的联姻,可能么?Joe McKendrick在其最新的 博文 中称,此结合非常有益,尤其对SOA,因为数据即平台可以极大程度上简化数据整合:

openkk 2011-11-05   16214   0
Hadoop   SOA  

Hadoop子项目 ZooKeeper 3.3.4 发布 资讯

ZooKeeper是Hadoop的正式子项目,它是一个针对大型分布式系统的可靠协调系统,提供的功能包括:配置维护、名字服务、分布式同步、组服务等。ZooKeeper的目标就是封装好复杂易出错的关键服务

fmms 2011-11-29   17508   1
Hadoop  
1 2 3 4 5 6 7 8 9 10