开源项目,开源代码,开源文档,开源新闻,开源社区_深度开源

P

Hadoop是一个分布式系统基础架构，由Apache基金会开发。用户可以在不了解分布式底层细节的情况下，开发分布式程序。充分利用集群的威力高速运算和存储。简单地说来，Hadoop是一个可以更容易开发和运行处理大规模数据的软件平台。 Hadoop实现了一个分布式文件系统（Hadoop Distributed File System），简称HDFS。HDFS有着高容错性（fault-tolerent）的特点，并且设计用来部署在低廉的（low-cost）硬件上。而且它提供高传输率（high throughput）来访问应用程序的数据，适合那些有着超大数据集（large data set）的应用程序。HDFS放宽了（relax）POSIX的要求（requirements）这样可以流的形式访问（streaming access）文件系统中的数据。

perfectqgw 2012-11-18 3212 0

Hadoop 分布式/云计算/大数据

P

Hadoop是一个分布式系统基础架构，由Apache基金会开发。用户可以在不了解分布式底层细节的情况下，开发分布式程序。充分利用集群的威力高速运算和存储。简单地说来，Hadoop是一个可以更容易开发和运行处理大规模数据的软件平台。Hadoop实现了一个分布式文件系统（Hadoop Distributed File System），简称HDFS。HDFS有着高容错性（fault-tolerent）的特点，并且设计用来部署在低廉的（low-cost）硬件上。而且它提供高传输率（high throughput）来访问应用程序的数据，适合那些有着超大数据集（large data set）的应用程序。HDFS放宽了（relax）POSIX的要求（requirements）这样可以流的形式访问（streaming access）文件系统中的数据。

wanjia19 2011-08-10 6182 0

Hadoop 分布式/云计算/大数据

P3

Hadoop任务调度在Master上运行的是JobTracker守护进程，而在Slave上运行的是TaskTracker守护进程。对于一个作业，首先提交给JobTracker，再由JobTracker对提交的作业进行处理。

thinkingx 2011-12-15 5872 0

Hadoop 分布式/云计算/大数据

P2

Hadoop API组成 Hadoop API被分成（divide into）如下几种主要的包（package）序号名称说明 1. org.apache.hadoop.conf 定义了系统参数的配置文件处理API。

willfly 2011-08-28 4194 0

Hadoop 分布式/云计算/大数据

P7

所有的Hadoop命令均由bin/hadoop脚本引发。不指定参数运行hadoop脚本会打印所有命令的描述。 The general command line syntax is: hadoop [--config

xfj3526 2012-06-13 3684 0

Hadoop 分布式/云计算/大数据

P41

Hadoop Map/Reduce教程[一] 编辑 | 删除 | 权限设置 | 更多▼ 更多▲ · 设置置顶 · 推荐日志 · 转为私密日志开心延年发表于2009年11月02日 00:15

wentao 2012-02-03 2837 0

Hadoop 分布式/云计算/大数据

P50

科技改变生活! 思数科技集群部署入门修订记录日期修改原因描述作者 2012/02/14 初稿 Hadoop部署文档 2012/07/14 完善细节新基础环境配置,修改配置文件,修改架构图。 2012/07/16

ka520 2015-11-14 434 0

Hadoop 分布式/云计算/大数据手册

一、Hadoop Streaming 它是hadoop的一个工具，用来创建和运行一类特殊的map/reduce作业。所谓的特殊的map/reduce作业可以是可执行文件或脚本本件（python、P

jopen 2011-12-21 55545 0

Hadoop 分布式/云计算/大数据

概述所有的hadoop命令均由bin/hadoop脚本引发。不指定参数运行hadoop脚本会打印所有命令的描述。用法：hadoop [--config confdir] [COMMAND]

jopen 2012-02-01 4317 0

P27

发现异常 MapReduce 参与计算角色窥探 JOB 运行 MR 提供重写接口配置参数调优 Hadoop 组成 3. HDFS 文件系统 4. HDFS 什么是文件系统文件系统：操作系统用于明确磁盘或分区上的文件的方法和数据结构；

gppxm 2012-10-19 2076 0

Hadoop 分布式/云计算/大数据报告

P35

1. Hadoop入门卢学裕@优酷网 2012.07 2. OutlinesHadoop Overview HDFS Map-reduce Programming Paradigm Hadoop Map-reduce

也许那样飞 2016-01-15 2782 0

分布式/云计算/大数据

P49

1. Lecture 11 – Hadoop Technical Introduction 2. TerminologyGoogle calls it:Hadoop equivalent:MapRed

Eric_V72 2013-10-20 347 0

Hadoop 分布式/云计算/大数据 x86 Java Go

如果觉得有帮助的话就顶下吧在统计的时候经常会用到排重，比如想统计每日登陆用户，但是一个用户一次多次登陆情况，或者一个产品被多少个用户下载。。

ygp8 2015-09-05 6606 0

Hadoop 分布式/云计算/大数据

im/2016/03/05/hadoop-101/ Hadoop 2.0 架构 Hadoop 包括如下几个模块： Hadoop Common：公共基础组件； Hadoop Distributed File

JaquelineEc 2016-03-04 22471 0

Hadoop 分布式系统分布式/云计算/大数据

让hive支撑在hbase数据库层面的 hql查询.hive也即做数据仓库 1. 基于Hadoop+Hive架构对海量数据进行查询：http://blog.csdn.net/kunshan_s

jopen 2012-02-04 180500 0

Hadoop 分布式/云计算/大数据

Hadoop集群配置部分参数：设置dfs.name.dir 时，通过逗号分隔多个值，可以使namenode将元数据存储到多个副本，以便namenode出错时恢复。 dfs.data.dir也可设

jopen 2014-01-28 18751 0

Hadoop 分布式/云计算/大数据

启动Hadoop 进入HADOOP_HOME 目录。执行 sh bin/start-all.sh 关闭Hadoop 进入HADOOP_HOME目录。执行sh bin/stop-all.sh

jopen 2014-10-29 16967 0

Hadoop 分布式/云计算/大数据

2 安装准备创建hadoop用户使用专有用户进行相关操作 # 创建hadoop用户组 groupadd hadoop # 创建hadoop用户 useradd hadoop # 设置密码 passwd

ymc4 2015-02-11 28859 0

Hadoop 分布式/云计算/大数据

简介 HDFS （Hadoop Distributed File System ）Hadoop分布式文件系统。是根据google发表的论文翻版的。论文为GFS（Google File System）Google

wdey 2015-05-24 13886 0

HDFS 分布式/云计算/大数据

P10

Hadoop包括hdfs与mapreduce两部分，在使用期期间我主要看了mapreduce部分，即hadoop执行作业的部分。 1. mapreduce中几个主要的概念 mapreduce整体上可

szx85307 2012-05-28 2711 0

Hadoop 分布式/云计算/大数据

K-means Hadoop 的相关搜索

1 2 3 4 5 6 7 8 9 10

关键词

Hadoop 机器学习推荐引擎分布式/云计算/大数据 K-means KNN DominantColor