P49

  文档式数据库在Hadoop集群中的应用 文档

1. 文档式数据库 在Hadoop集群中的应用SequoiaDB – 王涛 2. 提纲大数据回顾1数据库在Hadoop中的定位3用户案例4文档式数据库特性2 3. 大数据回顾Batch Analytics

tony2007 2015-06-19   1856   0

破解迷雾:关于大数据Hadoop的九大误区 资讯

将大家引入歧途。 大数据分析目前已经成为技术业界的主流趋势,每一家企业都开始将此类方案视为实现自身差异化优势的核心甚至是求得生存的关键所在。有鉴于此,关于 大数据的各种误解也开始不断涌现。这些

jopen 2015-06-23   11979   0
Hadoop  
P36

  以Hadoop为核心的大数据开放平台建设 文档

1. 以Hadoop为核心的大数据开放平台建设孙利兵驾驭大数据http://www.xfyun.cn/ 2. 大数据技术发展Native lib Checksum 机制 ShortCircuit Read一头奔跑的大象,不断进化YARN

w327 2015-05-25   779   0

Hadoop数据仓库的终结者吗? 资讯

在过去三年,Hadoop生态系统已经大范围扩展,很多主要IT供应商都推出了Hadoop连接器,以增强Hadoop的顶层架构或是供应商自 己使用的Hadoop发行版。鉴于Hadoop的部署率呈指数级的增

jopen 2014-01-14   17929   0
Hadoop  

Hive:基于hadoop数据仓库工具 经验

Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件 映射为一张数据库表,并提供完整的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。其优点是学习成本低,可以通过类SQL语句快

jopen 2014-11-25   24320   0

Hadoop 数据管理平台:Apache Falcon 经验

Falcon 提供了一个用于治理和编排 Hadoop 内部和周边数据流的数据处理框架。该框架为获取和处理数据集、复制与保留数据集、重新定向位于非Hadoop扩展中的数据集、维护审核跟踪与沿袭提供了关 键性

jopen 2015-01-19   24215   0

Hadoop时代的大数据架构 经验

提 到大数据分析平台,不得不说Hadoop系统,Hadoop到现在也超过10年的历史了,很多东西发生了变化,版本也从0.x进化到目前的2.6版本。我 把2012年后定义成后Hadoop平台时代,这不是说不用Hadoop,而是像NoSQL

b77m 2015-04-22   140189   0

数据(一) - hadoop生态系统及版本演化 经验

HDFS:分布式存储系统(Hadoop Distributed File System):提供了高可靠性、高扩展性和高吞吐率的数据存储服务 HDFS源自于Google的GFS论文 (发表于2003年10月 ),是GFS克隆版

jopen 2016-01-20   22814   0
P32

  基于hadoop数据仓库技术 文档

1. 基于hadoop数据仓库技术 2. 目录Hadoop简介 HDFS (Hadoop Distributed File System) MapReduce Hive本文的内容主要来自三篇hadoop领域的核心论文

cqn1512 2013-05-02   3410   0
P30

  淘宝Hadoop数据分析 文档

1Hadoop数据分析淘宝数据平台及产品部基础研发组 周敏日期:2010-05-26 2. OutlineHadoop基本概念 Hadoop的应用范围 Hadoop底层实现原理 Hive与数据分析

lxz 2014-01-03   3863   0
P36

  以Hadoop为核心的大数据开放平台建设 文档

1. 以Hadoop为核心的大数据开放平台建设孙利兵驾驭大数据http://www.xfyun.cn/ 2. 大数据技术发展Native lib Checksum 机制 ShortCircuit Read一头奔跑的大象,不断进化YARN

ee37 2015-07-05   501   0
P12

  淘宝 Hadoop 数据分析实践 文档

1. 淘宝Hadoop数据分析实践淘宝 数据平台与产品部 周敏(周忱) 2. 数据分析选型历程 Hadoop简介 系统架构 集群介绍 近期对Hadoop的改造实践主要内容 3. webalizer awstat 般若

wsldg 2012-02-28   678   0

Hadoop 通用数据摄取框架:Gobblin 经验

Gobblin 是 Hadoop 通用数据摄取框架,可以从各种数据源中提取,转换和加载海量数据。比如:数据库,rest APIs,filers,等等。Gobblin 处理日常规划任务需要所有数据摄取 ETLs

jopen 2015-09-15   31462   0

Hadoop数据处理解决方案:Cascalog 经验

Cascalog 是 Hadoop 上的数据处理解决方案,无需 hassle。 Cascalog 是 Clojure 或者 Java 的全功能数据处理和查询库。Cascalog 主要的作用是处理 Hadoop

jopen 2014-10-29   14108   0

微软数据库拥抱Hadoop 资讯

Kumert 宣布 , Hadoop 分布式计算平台将整合到下一个版本的关系数据库 SQL Server 2012、Windows Server 和 Azure 中。 Hadoop 是一个顶级 Apache

jopen 2011-10-14   30596   2
Hadoop  

数据处理一定需要Hadoop吗? 资讯

Google强大的搜寻引擎每天处理庞大的搜寻数据,靠的是数十万的伺服器同时作工。然而一般企业并无法使用Google所用的内部搜寻引擎工具,所以,拥有处理大数据工具的分散式运算平台Hadoop应运而生。 但问题是Hadoop使用上有难

dy223 2015-03-26   12892   0

Cascading——针对Hadoop MapReduce的数据处理API 博客

这些步骤定义了将要进行的数据处理,而流就是带有数据源与数据接收 器(data-sink)的管道的联合。 Cascading是一个新式的针对Hadoop clusters的数据处理API,它使用富于表现

Hadoopp 2012-09-28   1196   0

Hadoop 开源项目

Hadoop是一个用于运行应用程序在大型集群的廉价硬件设备上的框架。Hadoop为应用程序透明的提供了一组稳定/可靠的接口和数据运动。在Hadoop中实现了Google的MapReduce算法,它能够

码头工人 2019-01-17   890   0

hadoop 博客

hadoop找到这里,留个脚印

qooxdoo 2010-11-28   1466   0

Google 复杂的招聘流程 资讯

Business insider 网站 称为不可思议的复杂: 招聘人员审查简历:招聘人员要审查每一份简历,根据技术能力、教育程度和工作经验来判断是否合格。 招聘人员电话通知:招聘人员会联系你,解释过程,让你知道应该有什么

jopen 2011-10-27   8309   1
Google  
1 2 3 4 5 6 7 8 9 10