0推荐
72K 浏览

利用Mahout实现在Hadoop上运行K-Means算法

Mahout是Apache下的开源机器学习软件包,目前实现的机器学习算法主要包含有协同过滤/推荐引擎,聚类和分类三 个部分。Mahout从设计开始就旨在建立可扩展的机器学习软件包,用于处理大...
jopen 11年前   
算法   Hadoop   Mahout  
0推荐
20K 浏览

Hadoop2.2.0安装配置手册

Hadoop我们从Apache官方网站直接下载最新版本Hadoop2.2。官方目前是提供了linux32位系统可执行文件,所以如果需要在64位系统上部署则需要单独下载src 源码自行编译(1...
0推荐
56K 浏览

Hadoop完全分布式搭建

Hadoop是Apache软件基金会旗下的一个开源分布式计算平台。以Hadoop分布式文件系统(HDFS,Hadoop Distributed Filesystem)和MapReduce(Goo...
0推荐
29K 浏览

Hadoop上时实类SQL查询系统对比

以前只用过Hive与impala两个类SQL查询系统,最近又将Hortonworks开源的Stinger与Apache的Drill做了些调研。累死累活搞了一天的资料,头都大了。为了纪念我那逝去的...
0推荐
306K 浏览

hadoop框架详细分析

mapreduce是一种模式,一种什么模式呢?一种云计算的核心计算模式,一种分布式运算技术,也是简化的分布式编程模式,它主要用于解决问题的程序开发模型,也是开发人员拆解问题的方法。
0推荐
33K 浏览

Hadoop完全分布式模式的安装和配置

Hadoop完全分布式模式的安装和配置
0推荐
199K 浏览

Hadoop家族学习路线图

主要介绍Hadoop家族产品,常用的项目包括Hadoop, Hive, Pig, HBase, Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa,新增...
0推荐
70K 浏览

Hadoop集群部署及常见问题超细详解答

Hadoop是Apache软件基金会旗下的一个开源分布式计算平台。以Hadoop分布式文件系统(HDFS,Hadoop Distributed Filesystem)和MapReduce(Goo...
0推荐
16K 浏览

Hadoop资源管理器:Apache Hadoop NextGen MapReduce (YARN)

YARN是新一代Hadoop资源管理器,通过YARN,用户可以运行和管理同一个物理集群机上的多种作业,例如MapReduce批处理和图形处理作业。这样不仅可以巩固一个组织管理的系统数目,而且可以...
0推荐
22K 浏览

Hadoop安装配置(入门)

本文主要记录Hadoop-0.20.2安装过程,包括安装过程中的关键问题的解决。这里将安装过程分为三步: 第一步,打通筋脉,也就是配置各个节点间的环境,如创建hadoop用户和用户组,配置节点...
0推荐
35K 浏览

Hadoop 中利用 mapreduce 读写 mysql 数据

有时候我们在项目中会遇到输入结果集很大,但是输出结果很小,比如一些 pv、uv 数据,然后为了实时查询的需求,或者一些 OLAP 的需求,我们需要 mapreduce 与 mysql 进行数据的...
0推荐
31K 浏览

Android(HTC G7) 安装 Hadoop 伪分布

在HTC G7 上运行 ubuntu for android。并安装jdk1.7 arm 和 hadoop。 期间遇到了ssh问题,等各种问题,对于需要安装Ubuntu系统的手机,首先需要获...
0推荐
33K 浏览

使用 Azure、Hadoop 和 Mahout 构建一个推荐系统

使用 Azure、Hadoop 和 Mahout 构建一个推荐系统
jopen 11年前   
Hadoop   Mahout  
0推荐
26K 浏览

Hadoop 实现多文件输出

Hadoop 实现多文件输出
0推荐
39K 浏览

Hadoop 统计文件中某个单词出现的次数

Hadoop 统计文件中某个单词出现的次数
0推荐
84K 浏览

Hadoop HDFS文件操作的Java代码

Hadoop HDFS文件操作的Java代码
0推荐
15K 浏览

在Ubuntu上安装集群模式的Hadoop

在安装好单机模式的hadoop之后,我们就可以着手来在集群模式下安装hadoop了。在安装了单机版hadoop的机器上将hadoop转成集群模式是很容易的。首先来设置网络。
0推荐
27K 浏览

Hadoop的架构知识

Hadoop是一个能够对大量数据进行分布式处理的软件框架,实现了Google的MapReduce编程模型和框架,能够把应用程序分割成许多小的工作单元,并把这些单元放到任何集群节点上执行。在Map...
0推荐
49K 浏览

淘宝Hadoop作业平台:宙斯Zeus

淘宝Hadoop作业平台宙斯(zeus)开源啦!一站式作业平台,分布式设计,集中式管理,云一般的服务。功能与交互的深度契合。一切只为提供绝佳的用户体验。宙斯不仅仅是开源技术,更是开源一个融入了我...
0推荐
17K 浏览

在 OpenStack 上运行:Hadoop Savanna

因为有了 Savanna ,两个最大的开源项目 Hadoop 和 OpenStack 可以在一起工作。这是红帽、Hortonworks 和 Mirantis 新开发的 OpenStack 组件。...
1 2 3 4 5 6 7 8 9 10

经验分享,提升职场影响力

投稿

热门问答

    热门文档