登录
注册
首页
项目
经验
代码
文库
问答
博客
资讯
Spark SQL
(共
11
篇经验)
0
推荐
28K
浏览
SparkSQL-从DataFrame说起
本着更好地理解大数据生态圈的本意以及工作的需要,前段时间熟悉了SQL查询引擎SparkSQL、Hadoop文件格式Parquet/CarbonData、大数据基准测试标准TPCDS/TPCH等相...
MarthaRagan
8年前
数据库
Spark SQL
0
推荐
19K
浏览
如何让你的 Spark SQL 查询加速数十倍?
传统的数据库通常以行单位做数据存储,而列式存储(后文均以列存储简称)以列为单位做数据存储
gentlesie
8年前
SQL
Spark SQL
0
推荐
12K
浏览
为什么说Spark SQL远远超越了MPP SQL
这里说的并不是性能,因为我没尝试对比过(下文会有简单的说明),而是尝试从某种更高一层次的的角度去看,为什么Spark SQL 是远远超越MPP SQL的。
GustavoGaga
8年前
SQL
Spark SQL
分布式/云计算/大数据
0
推荐
17K
浏览
RDD、DataFrame和DataSet的区别是什么
RDD、DataFrame和DataSet是容易产生混淆的概念,必须对其相互之间对比,才可以知道其中异同:DataFrame多了数据的结构信息,即schema。RDD是分布式的 Java对象的集...
si19891002
9年前
数据挖掘
分布式系统
Spark SQL
0
推荐
64K
浏览
Spark SQL编程指南(Python)
Spark SQL允许我们在Spark环境中使用SQL或者Hive SQL执行关系型查询。它的核心是一个特殊类型的Spark RDD:SchemaRDD。
jopen
9年前
Spark SQL
分布式/云计算/大数据
0
推荐
24K
浏览
Databircks连城:Spark SQL结构化数据分析
数据科学家们早已熟悉的R和Pandas等传统数据分析框架 虽然提供了直观易用的API,却局限于单机,无法覆盖分布式大数据场景。在Spark 1.3.0以Spark SQL原有的SchemaRDD...
jopen
9年前
Spark SQL
分布式/云计算/大数据
0
推荐
61K
浏览
Spark SQL性能优化
Spark SQL性能优化
jopen
9年前
Spark SQL
分布式/云计算/大数据
0
推荐
78K
浏览
用Apache Spark进行大数据处理——第二部分:Spark SQL
在Apache Spark文章系列的前一篇文章中,我们学习了什么是Apache Spark框架,以及如何用该框架帮助组织处理大数据处理分析的需求。
jopen
9年前
Spark SQL
分布式/云计算/大数据
0
推荐
71K
浏览
Spark SQL中对Json支持的详细介绍
在这篇文章中,我将介绍一下Spark SQL对Json的支持,这个特性是Databricks的开发者们的努力结果,它的目的就是在Spark中使得查询和创建JSON数据变得非常地简单。随着WEB和...
jopen
10年前
Spark SQL
分布式/云计算/大数据
0
推荐
177K
浏览
Spark SQL 初探: 使用大数据分析2000万数据
Spark是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用的并行计算框架,Spark基于map reduce算法实现的分布式计算,拥有Hadoop Map...
jopen
10年前
Spark SQL
分布式/云计算/大数据
0
推荐
19K
浏览
Spark SQL 代码简要阅读(基于Spark 1.1.0)
Spark SQL允许相关的查询如SQL,HiveQL或Scala运行在spark上。其核心组件是一个新的RDD:SchemaRDD,SchemaRDDs由 行对象组成,并包含一个描述此行对象的...
jopen
10年前
Spark SQL
分布式/云计算/大数据
经验分享,提升职场影响力
投稿
热门问答
热门文档