登录
注册
首页
项目
经验
代码
文库
问答
博客
资讯
Hadoop
(共
225
篇经验)
0
推荐
32K
浏览
hadoop分布式集群搭建
hadoop分布式集群搭建
openkk
12年前
Hadoop
分布式/云计算/大数据
0
推荐
67K
浏览
海量数据的二度人脉挖掘算法(Hadoop 实现)
最近做了一个项目,要求找出二度人脉的一些关系,就好似新浪微博的“你可能感兴趣的人” 中,间接关注推荐;简单描述:即你关注的人中有N个人同时都关注了 XXX 。
openkk
12年前
算法
Hadoop
0
推荐
38K
浏览
HDFS NameNode HA框架设计文档(HDFS-1623:High Availability Framework for HDFS NN)
有很多方式可以使得NN更加的Available,例如:减少启动时间,配置热刷选,减少升级时间,NN的手动或自动的Failover。本文档通过Failover来解决NN的SPOF问题 有很多种...
openkk
12年前
Hadoop
分布式/云计算/大数据
0
推荐
23K
浏览
hadoop执行分布式Process
要把N个超级大表导入HBase,N是按月来分的,表:亿+的行数,100+的字段。测试过sqoop,JDBC,性能都不满意,对任务失败重做也很麻烦,HBase的批量导出还靠谱点
openkk
12年前
Hadoop
分布式/云计算/大数据
0
推荐
23K
浏览
百度的Hadoop分布式文件系统图解:4000节点集群
百度的高性能计算系统(主要是后端数据训练和计算)目前有4000节点,超过10个的集 群,最大的集群规模在1000个节点以上。每个节点由8核CPU以及16G内存以及12TB硬盘组成,每天的数据生成量在3PB以上。
openkk
12年前
Hadoop
分布式/云计算/大数据
0
推荐
17K
浏览
Drill 一个分布式系统用于大型数据集的互动分析
Drill是一个分布式系统用于大型数据集的互动分析,类似于 Google 的 Dremel。
openkk
12年前
Hadoop
分布式/云计算/大数据
0
推荐
19K
浏览
开发基于VMware虚拟平台的Hadoop应用 Serengeti
全球虚拟化和云基础架构领导厂商VMware公司公布了最新开源项目 - Serengeti,支持企业能够在虚拟和云环境中快速部署、管理和扩展Apache Hadoop。用于在虚拟平台上快速开发一个...
openkk
12年前
Hadoop
分布式/云计算/大数据
0
推荐
25K
浏览
Hadoop和数据库数据迁移工具 Sqoop
Sqoop是一个用来将Hadoop和关系型数据库中的数据相互转移的工具,可以将一个关系型数据库(例如 : MySQL ,Oracle ,Postgres等)中的数据导入到Hadoop的HDFS中...
openkk
12年前
Hadoop
分布式/云计算/大数据
0
推荐
28K
浏览
Spring Hadoop - 在 Spring 框架下编写 Hadoop 应用的支持。
在Spring框架下支持编写 Hadoop 应用。Spring Hadoop使MapReduce、Streaming、Hive、Pig和级联工作能够通过Spring容器执行。Hadoop分布式文...
openkk
12年前
Spring
Hadoop
分布式/云计算/大数据
0
推荐
27K
浏览
Cascading - 基于Hadoop的数据管理和分析框架
Cascading是一个应用程序框架,能够帮助开发人员快速开发基于Apache Hadoop 的 健壮数据分析和数据管理应用程序。
openkk
12年前
Hadoop
分布式/云计算/大数据
0
推荐
16K
浏览
Hadoop批处理调度器 Azkaban
Azkaban是个简单的批处理调度器,用来构建和运行Hadoop作业或其他脱机过程。
openkk
12年前
Hadoop
分布式/云计算/大数据
0
推荐
39K
浏览
HCatalog - 基于Hadoop数据表和存储管理服务
Apache HCatalog是基于Apache Hadoop之上的数据表和存储管理服务。
openkk
12年前
Hadoop
分布式/云计算/大数据
0
推荐
20K
浏览
Hadoop标准化安装工具 Cloudera
Cloudera 的定位在于 Bringing Big Data to the Enterprise with Hadoop
openkk
12年前
Hadoop
分布式/云计算/大数据
0
推荐
30K
浏览
Hadoop的Python封装 Dumbo
著名音乐站点Last.fm发布了基于Python的Dumbo(小 飞象)项目,Dumbo能够帮助Python开发者更方便的编写Hadoop应用,并且Dumbo为MapReduce应用提供了灵活易...
openkk
12年前
Hadoop
存储系统
分布式/云计算/大数据
0
推荐
17K
浏览
Hadoop的Jython封装 Happy
Happy 为Jython开发者使用Hadoop框架提供了便利,Happy框架封装了Hadoop的复杂调用过程,让Map-Reduce开发变得更为容易。
openkk
12年前
Hadoop
分布式/云计算/大数据
0
推荐
97K
浏览
Hadoop 的分布式架构改进与应用
谈到分布式系统,就不得不提到Google的三驾马车:GFS[1],MapReduce[2]和BigTable[3]。 虽然Google没有开源这三个技术的实现源码,但是基于这三篇开源文档, Nu...
jopen
12年前
Hadoop
分布式/云计算/大数据
0
推荐
36K
浏览
hadoop mapreduce核心功能描述
应用程序通常会通过提供map和reduce来实现 Mapper和Reducer接口,它们组成作业的核心。
openkk
12年前
Hadoop
分布式/云计算/大数据
0
推荐
20K
浏览
MongoDB Hadoop Adapter
Hadoop的MongoDB适配器。需要MongoDB Java Driver 2.7.3+支持。
openkk
13年前
Hadoop
分布式/云计算/大数据
0
推荐
86K
浏览
Hadoop在Windows环境下的部署
经过一整天的折腾,参考了网上很多资料,我机器上的Hadoop似乎是配置成功了。下面分享一下详细的配置过程。也祝愿大家在配置的过程中少走弯路。
fmms
13年前
Hadoop
分布式/云计算/大数据
0
推荐
99K
浏览
Hadoop 集群常见错误
这里将自己在初识hadoop过程中遇到的一些错误做一个简单总结:
openkk
13年前
Hadoop
企业服务总线ESB
1
2
3
4
5
6
7
8
9
10
经验分享,提升职场影响力
投稿
热门问答
热门文档