MongoDB Hadoop Connector 1.0 正式版发布 资讯

MongoDB Hadoop Connector 1.0 正式版本。 MongoDB Hadoop Connector 的核心功能是允许读取 MongoDB 数据到 Hadoop MapReduce

openkk 2012-04-11   21638   1
Hadoop  

Spring for Apache Hadoop 2.3 M3 发布 资讯

Spring for Apache Hadoop 提供了 Spring 框架用于创建和运行 Hadoop MapReduce、Hive 和 Pig 作业的功能,包括 HDFS 和 HBase。如果你需要简单的基于

xdld 2015-09-22   16852   0
P8

  Hadoop集群测试方案及计划 v1.0 文档

Hadoop集群测试方案 1. 引言 随着云计算技术的飞速发展,越来越多的数据密集型企业相继出现.面临着这些海量的数据信息,包括结构化信息、半结构化信息及其非结构化信息,如何存储并对这些信息进行处理将是这些企业面临的巨大挑战.

lygkkk123 2012-08-21   570   0

hadoop框架详细分析 经验

略,集群可以具有良好的容错性,一部分节点的down机对集群的正常工作不会造成影响。 ok,你可以再简单看看下副图,整幅图是有关hadoop的作业调优参数及原理,图的左边是MapTask运行示意图,右边是ReduceTask运行示意图:

jopen 2013-11-28   306378   0

Hadoop家族学习路线图 经验

主要介绍Hadoop家族产品,常用的项目包括Hadoop, Hive, Pig, HBase, Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa,新增加的项目包括,YARN

jopen 2013-11-10   199151   0

Hadoop YARN常见问题以及解决方案 经验

本文汇总了几个hadoop yarn中常见问题以及解决方案,注意,本文介绍解决方案适用于hadoop 2.2.0以及以上版本。 (1) 默认情况下,各个节点的负载不均衡(任务数目不同),有的节点很

jopen 2014-05-14   15178   0

Hadoop集群间的hbase数据迁移 经验

集群中hbase的数据文件拷贝到本地 具体做法如下: 在hadoop目录下执行如下命令,拷贝到本地文件。 bin/hadoop fs -copyToLocal /hbase/tab_keywordflow

jopen 2012-09-04   508   0

hadoop 里执行 MapReduce 任务的几种方式 经验

"aa\tbb \tcc bb\tcc\tdd" > 3.txt hadoop fs -mkdir /data hadoop fs -put 3.txt /data 全文的例子均以该文

jopen 2012-10-15   39572   0

Hadoop 资源管理器 - Apache YARN 经验

Apache Hadoop YARN (Yet Another Resource Negotiator,另一种资源协调者)是一种新的 Hadoop 资源管理器,前不久被提升为高层次的Hadoop子项目。

jopen 2012-12-19   22161   0

Android(HTC G7) 安装 Hadoop 伪分布 经验

在HTC G7 上运行 ubuntu for android。并安装jdk1.7 arm 和 hadoop。 期间遇到了ssh问题,等各种问题,对于需要安装Ubuntu系统的手机,首先需要获得root 权限,简单的方法是使 

jopen 2013-07-26   30781   0

hadoop增加新节点实践 经验

第一步:修改将要增加节点的主机名 hadoop@datanode1:~$ vim /etc/hostname datanode2 第二步:修改host文件 hadoop@datanode1:~$

jopen 2014-09-14   17756   0

解析Hadoop 的集群管理与安全机制 经验

当前大一点的公司都采用了共享Hadoop集群的模式,这种模式可以减小维护成本,且避免数据过度冗余,增加硬件成本。共享集群类似于云计算或者云存储,面临的一个最大问题是安全。本文就对Hadoop 的集群管理与安全机制进行讲解。

jopen 2015-06-18   18658   0

hadoop2.5.1安装到虚拟机 经验

传输所有的依赖文件到其他服务器 scp -r dep root@192.168.234.112 :/home/hadoop/ 安装java,并配置环境变量 java -version 查看现有java版本 rpm

jopen 2014-12-03   107546   0

如何挑选合适的大数据或Hadoop平台? 经验

都采用了Hadoop。然而,当你已经决定要使用Hadoop来处理大数据时,首先碰到的问题就是如何开始以及选择哪一种产品。本文讨论了不同的选择,并推荐了每种选择的适用场合。 Hadoop平台的多种选择

jopen 2015-02-19   45764   0

不得不了解的Hadoop知识 经验

在去年曾经列出了一张应当了解的Hadoop 知识清单。如今2015年也已经少了两个月,我认为我现在应当检查一下大家对Hadoop的了解情况,同时在清单内容中增加一些技术。 首先,我希望大家不要忘记

fn67 2015-03-21   15211   0

Hadoop:分布式计算平台初探 经验

Hadoop是一个开发和运行处理大规模数据的软件平台,是Appach的一个用java语言实现开源软件框架,实现在大量计算机组成的集群中对海 量数据进行分布式计算。Hadoop框架中最核心设计就是:Ma

jopen 2014-12-03   24277   0

Hive:基于hadoop的数据仓库工具 经验

Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的sql查询功能,可以将sql语句转换为 MapReduce任务进行运行。其优点是学习成本低,可以通过

jopen 2014-12-03   24098   0

面向Hadoop框架的高级语言: Apache Pig 经验

Apache Pig 是用来处理大规模数据的高级查询语言,配合 Hadoop使用,可以在处理海量数据时达到事半功倍的效果,比使用Java,C++等语言编写大规模数据处理程序的难度要小N倍,实现同样的效果的代码

jopen 2014-12-04   22140   0

Hadoop 之 MapReduce 框架演变详解 经验

所谓的经典版本的MapReduce框架,也是Hadoop第一版成熟的商用框架,简单易用是它的特点,来看一幅图架构图: 上面的这幅图我们暂且可以称谓Hadoop的V1.0版本,思路很清晰,各个Client提交Job给一个统一的Job

jopen 2015-12-16   14385   0

hadoop再次集群搭建(5)-CDH Install 经验

最开始两个页面直接continue,然后会出现下面这个页面: 可以看出我们可以通过Cloudera Manager安装的hadoop组件。 接下来,配置我们要安装的服务器有哪些: 我这里有三台服务器。 接下来选择cdh版本:我选择最新的5

jopen 2016-01-18   19279   0
1 2 3 4 5 6 7 8 9 10