登录
注册
首页
项目
经验
代码
文库
问答
博客
资讯
Hive
(共
35
篇经验)
0
推荐
22K
浏览
英语流利说基础数据平台
随着大数据产品的日益成熟与稳定,如今不少互联网公司在数据产品所投入的运维工作已经越来越少,另外,加上国内云服务的不断普及,建立一套自己的大数据基础平台的成本也将变的更低。本文将向大家简要介绍流利...
hh306311
8年前
数据库
ETL
Hive
分布式/云计算/大数据
0
推荐
23K
浏览
从零自学Hadoop(18):Hive的CLI和JDBC
文章是哥(mephisto)写的,SourceLink 上一篇,我们对hive的数据导出,以及集群Hive数据的迁移进行描述。了解到了基本的hive导出操作。这里,我们将对hive的CL...
ylwp0804
9年前
JDBC
Hadoop
Hive
分布式/云计算/大数据
0
推荐
76K
浏览
Hive HWI 安装及配置
备忘,HWI安装过程,整理以前的记录,今又想起来重装一次,居然又遇到新的问题,由于是笔记,有点杂乱。 Hive Web Interface(HWI)简介:Hive自带了一个Web-GUI,功...
jopen
9年前
Hive
分布式/云计算/大数据
0
推荐
16K
浏览
Hive安装手册
Hive安装手册
jopen
9年前
Hive
数据挖掘
0
推荐
14K
浏览
Hive运行架构及配置部署
由Facebook开源,最初用于解决海量结构化的日志数据统计问题:ETL工具; 构建于Hadoop的HDFS和MapReduce智商,用于管理和查询结构化/非结构化数据的数据仓库;
jopen
9年前
Hive
分布式/云计算/大数据
0
推荐
16K
浏览
Impala与Hive的比较
Impala是Cloudera在受到Google的Dremel启发下开发的实时交互SQL大数据查询工具,Impala没有再使用缓慢的 Hive+MapReduce批处理,而是通过使用与商用并行...
jopen
10年前
Hive
分布式/云计算/大数据
0
推荐
36K
浏览
深入浅出数据仓库中SQL性能优化之Hive篇
一个Hive查询生成多个Map Reduce Job,一个Map Reduce Job又有Map,Reduce,Spill,Shuffle,Sort等多个阶段,所以针对Hive查询的优化可以大致...
jopen
10年前
SQL
Hive
0
推荐
18K
浏览
基于Docker的共享计算能力的工具:Hive
Hive是一个基于Docker的共享计算能力的工具,用户只需要在自己的机器上启动Docker进程并提交到Hive平台即可。
jopen
10年前
Hive
分布式/云计算/大数据
0
推荐
80K
浏览
Hive在腾讯数据仓库TDW中的应用
Hive是Apache基金会下的一个在Hadoop上构建数据仓库的开源软件,它支持通过类SQL的HQL语言操作结构化数据。Hive的主要功 能是将类SQL的HQL语言翻译成MapReduce代码...
jopen
10年前
Hive
数据挖掘
0
推荐
24K
浏览
Hive:基于hadoop的数据仓库工具
Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的sql查询功能,可以将sql语句转换为 MapReduce任务进行运行。其优点是学习成本低,可...
jopen
10年前
Hive
数据挖掘
0
推荐
24K
浏览
Hive:基于hadoop的数据仓库工具
Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件 映射为一张数据库表,并提供完整的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。其优点是学习成本低,可...
jopen
10年前
Hive
分布式/云计算/大数据
0
推荐
31K
浏览
Hive实战之日志分析
本文主要讲述使用 hive 的实践,业务不是关键,简要介绍业务场景,本次的任务是对搜索日志数据进行统计分析。 集团搜索刚上线不久,日志量并不大 。这些日志分布在 5 台前端机,按小时保存,并以...
jopen
10年前
Hive
分布式/云计算/大数据
0
推荐
37K
浏览
Hive学习的思维导图
Hive学习的思维导图
jopen
10年前
Hive
分布式/云计算/大数据
0
推荐
19K
浏览
Hive分区
1、在Hive Select查询中一般会扫描整个表内容,会消耗很多时间做没必要的工作。有时候只需要扫描表中关心的一部分数据,因此建表时引入了partition概念。
jopen
10年前
Hive
分布式/云计算/大数据
0
推荐
111K
浏览
Hive权限介绍
目前hive支持简单的权限管理,默认情况下是不开启,这样所有的用户都具有相同的权限,同时也是超级管理员,也就对hive中的所有表都有查看和改动的权利,这样是不符合一般数据仓库的安全原则的。Hiv...
jopen
10年前
Hive
数据挖掘
0
推荐
28K
浏览
数据仓库中的 SQL 性能优化(Hive篇)
一个Hive查询生成多个map reduce job,一个map reduce job又有map,reduce,spill,shuffle,sort等多个阶段,所以针对hive查询的优化可以大致...
jopen
10年前
Hive
数据挖掘
0
推荐
64K
浏览
Hive深入浅出
Hive 是建立在 Hadoop 上的数据仓库基础构架。它提供了一系列的工具,可以用来进行数据提取转化加载(ETL),这是一种可以存储、查询和分析存储在 Hadoop 中的大规模数据的机制。Hi...
jopen
10年前
Hive
数据挖掘
0
推荐
76K
浏览
基于 Hive 的文件格式:RCFile 简介及其应用
Hadoop 作为MR 的开源实现,一直以动态运行解析文件格式并获得比MPP数据库快上几倍的装载速度为优势。不过,MPP数据库社区也一直批评Hadoop由于文件格式并非为特定目的而建,因此序列化...
jopen
10年前
Hive
分布式/云计算/大数据
0
推荐
176K
浏览
Hive SQL 编译过程详解
Hive是基于Hadoop的一个数据仓库系统,在各大公司都有广泛的应用。美团数据仓库也是基于Hive搭建,每天执行近万次的Hive ETL计算流程,负责每天数百GB的数据存储和分析。Hive的稳...
jopen
10年前
Hive
数据挖掘
0
推荐
59K
浏览
Hive详细教程
基于Hadoop的大数据的计算/扩展能力 支持SQL like查询语言 统一的元数据管理 简单编程
jopen
10年前
Hive
1
2
经验分享,提升职场影响力
投稿
热门问答
热门文档