登录
注册
首页
项目
经验
代码
文库
问答
博客
资讯
Hadoop
(共
225
篇经验)
0
推荐
90K
浏览
Spring Hadoop - 整合Spring框架和Apache Hadoop平台的开源项目
这个项目整合了 Spring 框架和 Apache Hadoop 平台。该项目提供了一种方便的机制,让我们可以通过 Spring 容器来配置、创建和执行各种各样的服务和工具,像 MapReduc...
openkk
13年前
Spring
Hadoop
分布式/云计算/大数据
0
推荐
244K
浏览
HDFS小文件处理解决方案总结+facebook(HayStack) + 淘宝(TFS)
HDFS小文件处理解决方案总结+facebook(HayStack) + 淘宝(TFS)
openkk
13年前
Hadoop
分布式/云计算/大数据
0
推荐
27K
浏览
Spring Hadoop - 为开发 Apache Hadoop 应用程序提供支持
Spring Hadoop为开发 Apache Hadoop 应用程序提供支持,充分利用不着Spring, Spring Batch 和 Spring Integration 等项目提供的功能。
jopen
13年前
Spring
Hadoop
分布式/云计算/大数据
0
推荐
45K
浏览
基于Hadoop的数据收集系统 - Chukwa
什么是 Chukwa,简单的说它是一个数据收集系统,它可以将各种各样类型的数据收集成适合 Hadoop 处理的文件保存在 HDFS 中供 Hadoop 进行各种 MapReduce 操作。Chu...
openkk
13年前
Hadoop
分布式/云计算/大数据
0
推荐
27K
浏览
Hadoop入门 - Linux下伪分布式计算的安装与wordcount的实例展示
本人是在ubuntu下进行实验的,java和ssh安装就不在这里讲了,这两个是必须要安装的,好了我们进入主题安装hadoop。
fmms
13年前
Hadoop
分布式/云计算/大数据
0
推荐
57K
浏览
Hadoop Distributed System (HDFS) 写入和读取流程
HDFS全称是Hadoop Distributed System。HDFS是为以流的方式存取大文件而设计的。适用于几百MB,GB以及TB,并写一次读多次的场合。而对于低延时数据访问、大量小文件、...
fmms
13年前
Hadoop
分布式/云计算/大数据
0
推荐
67K
浏览
Hadoop - 你不得不了解的大数据工具
如今Apache Hadoop已成为大数据行业发展背后的驱动力。Hive和Pig等技术也经常被提到,但是他们都有什么功能,为什么会需要奇怪的名字(如Oozie,ZooKeeper、Flume)。
fmms
13年前
Hadoop
分布式/云计算/大数据
0
推荐
48K
浏览
Hadoop快速部署工具 EasyHadoop
EasyHadoop 是一个Hadoop一键安装脚本,方便大家更容易安装部署Hadoop软件。
fmms
13年前
Hadoop
分布式/云计算/大数据
0
推荐
112K
浏览
为什么Hadoop将一定会是分布式计算的未来?
Hadoop的创始源头在于当年Google发布的3篇文章,被称为Google的分布式计算三驾马车(Google还有很多很牛的文章,但是在分布式计算方面,应该这三篇的影响力最大了)。
fmms
13年前
Hadoop
分布式/云计算/大数据
0
推荐
57K
浏览
Hadoop HDFS分布式文件系统设计要点与架构
Hadoop简介:一个分布式系统基础架构,由Apache基金会开发。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力高速运算和存储。Hadoop实现了一个分布式文件系统...
openkk
13年前
Hadoop
分布式/云计算/大数据
0
推荐
44K
浏览
hadoop hive sql语法详解
hadoop hive sql语法详解
openkk
13年前
Hadoop
Hive
分布式/云计算/大数据
0
推荐
151K
浏览
Hadoop 实战实例
Hadoop 是Google MapReduce的一个Java实现。MapReduce是一种简化的分布式编程模式,让程序自动分布到一个由普通机器组成的超大集群上并发执行。就如同java程序员可以...
fmms
13年前
Hadoop
分布式/云计算/大数据
0
推荐
170K
浏览
Nutch+Hadoop集群搭建
Apache Nutch是一个用于网络搜索的开源框架,它提供了我们运行自己的搜索引擎所需的全部工具,包括全文搜索和Web爬虫。
fmms
13年前
搜索引擎
Hadoop
nutch
0
推荐
15K
浏览
分布式存储系统 Katta
Katta是一个可扩展的、故障容错的、分布式实施访问的数据存储。
fmms
13年前
Hadoop
Lucene
分布式/云计算/大数据
0
推荐
121K
浏览
Hadoop 集群配置(最全面)
通常,集群里的一台机器被指定为 NameNode,另一台不同的机器被指定为JobTracker。这些机器是masters。余下的机器即作为DataNode也作为TaskTracker。
fmms
13年前
Hadoop
分布式/云计算/大数据
0
推荐
180K
浏览
Hadoop Hive与Hbase整合
用hbase做数据库,但由于hbase没有类sql查询方式,所以操作和计算数据非常不方便,于是整合hive,让hive支撑在hbase数据库层面 的 hql查询.hive也即 做数据仓库
jopen
13年前
Hadoop
分布式/云计算/大数据
0
推荐
249K
浏览
工作流引擎服务器 Hadoop Oozie 介绍
Oozie是一个工作流引擎服务器,用于运行Hadoop Map/Reduce和Pig 任务工作流.同时Oozie还是一个Java Web程序,运行在Java Servlet容器中,如Tomcat.
jopen
13年前
工作流引擎
Hadoop
0
推荐
30K
浏览
Ubuntu11.10下安装Hadoop1.0.0(单机伪分布式)
Ubuntu11.10下安装Hadoop1.0.0(单机伪分布式)
fmms
13年前
Hadoop
分布式/云计算/大数据
0
推荐
60K
浏览
Hadoop入门之HDFS与MapReduce
Hadoop的核心就是HDFS与MapReduce
fmms
13年前
Hadoop
分布式/云计算/大数据
0
推荐
105K
浏览
开源云计算系统 Spark
Spark是一个开源的集群计算系统,用于快速数据分析,包括快速运行和快速写操作。
fmms
13年前
Scala
Hadoop
分布式/云计算/大数据
1
2
3
4
5
6
7
8
9
10
经验分享,提升职场影响力
投稿
热门问答
热门文档