P30

  淘宝Hadoop数据分析 文档

1Hadoop数据分析淘宝数据平台及产品部基础研发组 周敏日期:2010-05-26 2. OutlineHadoop基本概念 Hadoop的应用范围 Hadoop底层实现原理 Hive与数据分析

lxz 2014-01-03   3863   0
P36

  以Hadoop为核心的大数据开放平台建设 文档

1. 以Hadoop为核心的大数据开放平台建设孙利兵驾驭大数据http://www.xfyun.cn/ 2. 大数据技术发展Native lib Checksum 机制 ShortCircuit Read一头奔跑的大象,不断进化YARN

ee37 2015-07-05   501   0
P12

  淘宝 Hadoop 数据分析实践 文档

1. 淘宝Hadoop数据分析实践淘宝 数据平台与产品部 周敏(周忱) 2. 数据分析选型历程 Hadoop简介 系统架构 集群介绍 近期对Hadoop的改造实践主要内容 3. webalizer awstat 般若

wsldg 2012-02-28   678   0

Hadoop 通用数据摄取框架:Gobblin 经验

Gobblin 是 Hadoop 通用数据摄取框架,可以从各种数据源中提取,转换和加载海量数据。比如:数据库,rest APIs,filers,等等。Gobblin 处理日常规划任务需要所有数据摄取 ETLs

jopen 2015-09-15   31462   0

Hadoop数据处理解决方案:Cascalog 经验

Cascalog 是 Hadoop 上的数据处理解决方案,无需 hassle。 Cascalog 是 Clojure 或者 Java 的全功能数据处理和查询库。Cascalog 主要的作用是处理 Hadoop

jopen 2014-10-29   14108   0

微软数据库拥抱Hadoop 资讯

Kumert 宣布 , Hadoop 分布式计算平台将整合到下一个版本的关系数据库 SQL Server 2012、Windows Server 和 Azure Hadoop 是一个顶级 Apache

jopen 2011-10-14   30596   2
Hadoop  

数据处理一定需要Hadoop吗? 资讯

Google强大的搜寻引擎每天处理庞的搜寻数据,靠的是数十万的伺服器同时作工。然而一般企业并无法使用Google所用的内部搜寻引擎工具,所以,拥有处理大数据工具的分散式运算平台Hadoop应运而生。 但问题是

dy223 2015-03-26   12892   0

Cascading——针对Hadoop MapReduce的数据处理API 博客

这些步骤定义了将要进行的数据处理,而流就是带有数据源与数据接收 器(data-sink)的管道的联合。 Cascading是一个新式的针对Hadoop clusters的数据处理API,它使用富于表现

Hadoopp 2012-09-28   1196   0

hadoop执行分布式Process 经验

要把N个超级表导入HBase,N是按月来分的,表:亿+的行数,100+的字段。测试过sqoop,JDBC,性能都不满意,对任务失败重做也很麻烦,HBase的批量导出还靠谱点,但这样导入HBase有几个麻烦的地方:

openkk 2012-08-31   22642   0

hadoop分布式安装 经验

iptables status 2、HDFS 启动 sbin/hadoop-daemon.sh start/stop namenode sbin/hadoop-daemon.sh start/stop

jopen 2016-01-03   13690   0
P8

  Lucene+Hadoop分布式 文档

Nut开发环境搭建(虚拟机下hadoop0.20.2+zookeeper3.3.3+hbase0.90.2开发环境的搭建) blog: http://www.blogjava.net/nianzai/

huaxinmifeng 2011-10-27   7864   0

hadoop分布式部署 经验

配置如下: hadoop1.example.com:192.168.2.1(NameNode) hadoop2.example.com:192.168.2.2(DataNode) hadoop3.example

jopen 2014-07-15   22927   0

分布式团队面临的五问题及解决办法 经验

情况下,它可以被归结为我们所面对的五问题。 什么是分布式团队? 在讨论这五问题(和相应的解决方案)之前,让我们先定义什么是分布式的团队。在我培训课程,很多人都会问这个问题。我认为,只要你

百度的Hadoop分布式文件系统图解:4000节点集群 经验

百度的高性能计算系统(主要是后端数据训练和计算)目前有4000节点,超过10个的集 群,最大的集群规模在1000个节点以上。每个节点由8核CPU以及16G内存以及12TB硬盘组成,每天的数据生成量在3PB以上。规划当中的架构将有

openkk 2012-08-25   23315   0
P21

  途牛多数据中心分布式数据库同步 文档

(本页无文本内容) 2. 多机房分布式数据库同步谭俊青@途牛 mysqlab.net 3. 背景 南、北数据同步存在延时 南、北专线可能会意外中断 南、北业务都不能中断 本地读取数据一致性不能得到保证 灾备需要

ww47 2015-03-06   3497   0

FiloDB:用于大数据分析的分布式数据 资讯

Chan 详细介绍 了用于大数据分析的分布式数据库FiloDB,对其主要特点和所包含模块进行了分析。 在当今的大数据时代,越来越多的企业需要对结构化的数据进行分析和查询,需要对流数据进行快速处理和更新。以

jopen 2015-11-05   24157   0
FiloDB  
P21

  途牛多数据中心分布式数据库同步 文档

(本页无文本内容) 2. 多机房分布式数据库同步谭俊青@途牛 mysqlab.net 3. 背景 南、北数据同步存在延时 南、北专线可能会意外中断 南、北业务都不能中断 本地读取数据一致性不能得到保证 灾备需要

byc2 2014-11-19   2879   0

针对Hadoop数据处理应用程序的新分布式执行框架: Apache Tez 经验

你可能听说过 Apache Tez ,它是一个针对 Hadoop 数据处理应用程序的新分布式执行框架。但是它到底是什么呢?它的工作原理是什么?哪些人应该使用它,为什么?如果你有这些疑问,那么可以看一下

jopen 2014-10-13   30952   0
P5

  10分钟内理解云计算分布式数据处理框架Hadoop 文档

家林会带您在10分钟内理解云计算分布式数据处理框架Hadoop并开始动手实践,倒计时开始…… 第1分钟: Hadoop要解决的问题是什么? 答:Hadoop核心要解决长期IT界乃至人类社会的两主题: 1, 海量数据的存储:

xcxc 2015-08-23   651   0

胜利属于安卓,但并不属于谷歌 资讯

谁是谷歌在移动领域最害怕的对手? 答案也许出乎你的意料。当我们对比 2013 年底和 2012 年底的智能手机出货数据时惊讶的发现,谷歌安卓、苹果 iOS 的市场份额都在下降——而偷走市场空间的,正式那些基于谷歌安卓而衍生出来的定制版安卓系统。

jopen 2014-08-26   7124   0
安卓  
1 2 3 4 5 6 7 8 9 10