0推荐
90K 浏览

Spring Hadoop - 整合Spring框架和Apache Hadoop平台的开源项目

这个项目整合了 Spring 框架和 Apache Hadoop 平台。该项目提供了一种方便的机制,让我们可以通过 Spring 容器来配置、创建和执行各种各样的服务和工具,像 MapReduc...
0推荐
244K 浏览

HDFS小文件处理解决方案总结+facebook(HayStack) + 淘宝(TFS)

HDFS小文件处理解决方案总结+facebook(HayStack) + 淘宝(TFS)
0推荐
27K 浏览

Spring Hadoop - 为开发 Apache Hadoop 应用程序提供支持

Spring Hadoop为开发 Apache Hadoop 应用程序提供支持,充分利用不着Spring, Spring Batch 和 Spring Integration 等项目提供的功能。
0推荐
45K 浏览

基于Hadoop的数据收集系统 - Chukwa

什么是 Chukwa,简单的说它是一个数据收集系统,它可以将各种各样类型的数据收集成适合 Hadoop 处理的文件保存在 HDFS 中供 Hadoop 进行各种 MapReduce 操作。Chu...
0推荐
27K 浏览

Hadoop入门 - Linux下伪分布式计算的安装与wordcount的实例展示

本人是在ubuntu下进行实验的,java和ssh安装就不在这里讲了,这两个是必须要安装的,好了我们进入主题安装hadoop。
0推荐
57K 浏览

Hadoop Distributed System (HDFS) 写入和读取流程

HDFS全称是Hadoop Distributed System。HDFS是为以流的方式存取大文件而设计的。适用于几百MB,GB以及TB,并写一次读多次的场合。而对于低延时数据访问、大量小文件、...
0推荐
67K 浏览

Hadoop - 你不得不了解的大数据工具

如今Apache Hadoop已成为大数据行业发展背后的驱动力。Hive和Pig等技术也经常被提到,但是他们都有什么功能,为什么会需要奇怪的名字(如Oozie,ZooKeeper、Flume)。
0推荐
48K 浏览

Hadoop快速部署工具 EasyHadoop

EasyHadoop 是一个Hadoop一键安装脚本,方便大家更容易安装部署Hadoop软件。
0推荐
112K 浏览

为什么Hadoop将一定会是分布式计算的未来?

Hadoop的创始源头在于当年Google发布的3篇文章,被称为Google的分布式计算三驾马车(Google还有很多很牛的文章,但是在分布式计算方面,应该这三篇的影响力最大了)。
0推荐
57K 浏览

Hadoop HDFS分布式文件系统设计要点与架构

Hadoop简介:一个分布式系统基础架构,由Apache基金会开发。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力高速运算和存储。Hadoop实现了一个分布式文件系统...
0推荐
44K 浏览

hadoop hive sql语法详解

hadoop hive sql语法详解
0推荐
151K 浏览

Hadoop 实战实例

Hadoop 是Google MapReduce的一个Java实现。MapReduce是一种简化的分布式编程模式,让程序自动分布到一个由普通机器组成的超大集群上并发执行。就如同java程序员可以...
0推荐
170K 浏览

Nutch+Hadoop集群搭建

Apache Nutch是一个用于网络搜索的开源框架,它提供了我们运行自己的搜索引擎所需的全部工具,包括全文搜索和Web爬虫。
fmms 13年前   
0推荐
15K 浏览

分布式存储系统 Katta

Katta是一个可扩展的、故障容错的、分布式实施访问的数据存储。
0推荐
121K 浏览

Hadoop 集群配置(最全面)

通常,集群里的一台机器被指定为 NameNode,另一台不同的机器被指定为JobTracker。这些机器是masters。余下的机器即作为DataNode也作为TaskTracker。
0推荐
180K 浏览

Hadoop Hive与Hbase整合

用hbase做数据库,但由于hbase没有类sql查询方式,所以操作和计算数据非常不方便,于是整合hive,让hive支撑在hbase数据库层面 的 hql查询.hive也即 做数据仓库
0推荐
249K 浏览

工作流引擎服务器 Hadoop Oozie 介绍

Oozie是一个工作流引擎服务器,用于运行Hadoop Map/Reduce和Pig 任务工作流.同时Oozie还是一个Java Web程序,运行在Java Servlet容器中,如Tomcat.
jopen 13年前   
0推荐
30K 浏览

Ubuntu11.10下安装Hadoop1.0.0(单机伪分布式)

Ubuntu11.10下安装Hadoop1.0.0(单机伪分布式)
0推荐
60K 浏览

Hadoop入门之HDFS与MapReduce

Hadoop的核心就是HDFS与MapReduce
0推荐
105K 浏览

开源云计算系统 Spark

Spark是一个开源的集群计算系统,用于快速数据分析,包括快速运行和快速写操作。
1 2 3 4 5 6 7 8 9 10

经验分享,提升职场影响力

投稿

热门问答

    热门文档