P26

  基于Hadoop的电影推荐系统 文档

1. 基于Hadoop的电影推荐系统 答辩者:李婷婷 指导老师:师智斌 2. Hadoop在大型内容推荐系统中的应用 背景  推荐效果  技术选型  技术实现  推荐系统的评测  Hadoop&Hive使用经验

P24

  Hadoop 平台结构浅析 文档

1. Hadoop平台结构浅析什么是Hadoop? Hadoop是Apache下面的一个分布式并行计算框架,是从Lunece中抽取出来的一个框架。Hadoop的核心设计思想是MapReduce和HDFS

liu1122 2013-01-20   2848   0
P23

  Hadoop 运维杂记 文档

1. Hadoop运维杂记张月@蓝汛 2. 自我介绍张月 性别男,爱好女 就职于蓝汛Chinacache数据平台日志Team 工作内容:开发,运维基于hadoop数据平台及其生态系统;公司内部Hadoop技术推广;

lxz 2014-01-03   2998   0
P31

  Hadoop深入浅出 - MapReduce 文档

Serializable) 16. Hadoop序列化的特点序列化格式特点: 紧凑:高效使用存储空间。 快速:读写数据的额外开销小 可扩展:可透明地读取老格式的数据 互操作:支持多语言的交互 Hadoop的序列化格式:Writable

boke_jian 2014-08-21   2675   0

细细品味大数据--初识hadoop 经验

com/BaiYiShaoNian/p/4769178.html 初识hadoop 前言 之前在学校的时候一直就想学习大数据方面的技术,包括hadoop和机器学习啊什么的,但是归根结底就是因为自己太懒了,导致没有坚持多长时间,

jopen 2015-08-30   15444   0

Hadoop - Ambari集群管理剖析 经验

1.Overview Ambari是Apache推出的一个集中管理Hadoop的集群的一个平台,可以快速帮助搭建Hadoop及相关以来组件的平台,管理集群方便。这篇博客记录Ambari的相关问题和

jopen 2015-12-25   256529   0

elasticsearch-hadoop使用示例 经验

在elasticsearch-hadoop的具体使用中碰到了几个问题,有必要记录一下,避免下次遇到时又要重新研究。 利用spark读取es数据源的简单示例 import org.elasticsearch

jopen 2016-01-07   22370   0

hadoop2.6.3 集群部署 经验

root@slave1:~# 安装hadoop 下载hadoop2.6.3,下载链接 http://hadoop.apache.org/releases.html 解压 tar -xvf hadoop-2.6.3.tar

StevenGrey 2016-01-27   21394   0
P23

  Hadoop 源代码分析(MapReduce概论) 文档

2009-02-21 Hadoop源代码分析(MapReduce概论) 大家都熟悉文件系统,在对HDFS进行分析前,我们并没有花很多的时间去介绍HDFS的背景,毕竟大家对文件系统的还是有一定的理解的

gps2012 2013-01-14   247   0
P5

  hadoop集群配置范例 文档

HADOOP-0.20.2分布式集群配置 本文以安装和使用hadoop-0.20.2为例。 硬件环境 1. 虚拟机VMWare Workstation 6.5.2build 2. 三台机器均安装redhat

tony2007 2015-06-20   260   0

Hadoop平台集群搭建 经验

1. Linux配置hadoop环境 环境:Ubuntu10 linux、 jdk-7-linux-i586.tar.gz 1.1 将jdk上传到Ubuntu a. 在虚拟机中设置->选项->共享文件夹

jopen 2014-03-19   12260   0

hadoop 网站日志分析 经验

org.apache.hadoop.fs.Path; import org.apache.hadoop.io.IntWritable; import org.apache.hadoop.io.Text; import

jopen 2014-03-26   19031   0

Hadoop开发使用备记 经验

使用Hadoop已经有一段时间了,从开始的迷茫,到各种的尝试,到现在组合应用….慢慢地涉及到数据处理的事情,已经离不开hadoop了。Hadoop在大数据领域的成功,更引发了它本身的加速发展。现在Ha

jopen 2014-05-20   52523   0

Hadoop安装配置(入门) 经验

概述: 本文主要记录Hadoop-0.20.2安装过程,包括安装过程中的关键问题的解决。这里将安装过程分为三步: 第一步,打通筋脉,也就是配置各个节点间的环境,如创建hadoop用户和用户组,配置节点间ssh无密码连接;

jopen 2013-07-30   22400   0

基于Hadoop的实时查询:Cloudera Impala 经验

Cloudera 发布实时查询开源项目 Impala (黑斑羚)!多款产品实测表明,比原来基于MapReduce的Hive SQL查询速度提升3~90倍。Impala是Google Dremel的模仿,但在SQL功能上青出于蓝胜于蓝。

jopen 2012-10-24   35447   0

Hadoop作业调度管理系统 - Corona 经验

Corona,这是 Facebook 用来调度和管理大规模 Hadoop 作业的系统。 Corona 是 Map-Reduce 的改进版本,可以更好地利用集群资源,更适合 Facebook 的“多

jopen 2012-11-09   17046   0

Hadoop1.0.4集群安装 经验

Hadoop集群的安装 一 安装计划 虚拟机:VMware9.0 操作系统:CentOS5.8 HadoopHadoop1.0.4 网段为:192.168.201.1 三个节点分别为:

jopen 2013-04-15   13710   0

Hadoop 实现多文件输出 经验

要求按单词的首字母区分单词并分文件输出 代码如下: LineRecordWriter package com.hadoop.multi; import java.io.DataOutputStream; import

jopen 2013-07-11   25859   0

hadoop分布式部署 经验

配置如下: hadoop1.example.com:192.168.2.1(NameNode) hadoop2.example.com:192.168.2.2(DataNode) hadoop3.example

jopen 2014-07-15   22927   0

Hadoop集群 CentOS安装配置 经验

主机名和域名,详情请看" Hadoop集群_第 2 期_机器信息分布表 "。 表2.8-1 机器信息分布 机器名称 IP 地址 Master.Hadoop 192.168.1.2

jopen 2014-09-02   28066   0
1 2 3 4 5 6 7 8 9 10