什么是spark 经验

Spark是一个基于内存计算的开源的集群计算系统,目的是让数据分析更加快速。Spark非常小巧玲珑,由加州伯克利大学AMP实验室的Matei为主的小团队所开发。使用的语言是Scala,项目的core部

jopen 2014-08-14   51313   0

Spark SQL编程指南 经验

Spark SQL 编程指南 简介 Spark SQL支持在Spark中执行SQL,或者HiveQL的关系查询表达式。它的核心组件是一个新增的RDD类型JavaSchemaRDD。JavaSche

jopen 2014-09-01   93150   0

Spark初探 经验

Spark 基于内存计算,提高了在大数据环境下数据处理的实时性,同时保证了高容错性和高可伸缩性,允许用户将Spark 部署在大量廉价硬件之上,形成集群。 认识 Spark Apache Spark

jopen 2015-01-13   58340   0

Spark 内核研究 经验

1、Spark介绍 Spark是起源于美国加州大学伯克利分校AMPLab的大数据计算平台,在2010年开源,目前是Apache软件基金会的顶级项目。随着Spark在大数据计算领域的暂露头角,越来越

jopen 2015-01-29   28746   0

Spark介绍 经验

Spark是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用的并行计算框架,Spark基于map reduce算法实现的分布式计算,拥有Hadoop MapReduce所具有的优点;

jopen 2014-11-17   109482   0
P9

  Spark 笔记 文档

Managenment -- 缓存管理,对RDD的中间计算结果进行缓存管理以加快整体的处理速度 计算范式和抽象 Spark首先是一种粗粒度数据并行(data parallel)的计算范式。 数据并行跟任务并行(task

ylx1214 2015-04-18   1526   0
P35

  The Spark Project Today 文档

1. The Spark Project TodayAnd What’s NextAndy Konwinski@andykonwinski 2. Community 3. Project HistorySpark

aacall 2014-06-25   2747   0

Spark 集群概述 经验

com/a/1190000003889102 本篇博客简述 Spark 集群相关的概念。 概述 Spark 的"集群"不是提供运算服务的,而是一种资源分配的调度器。 执行任务的 Spark 进程作为客户端向"集群"申请资源(运算节点)

jopen 2015-10-22   10414   0

Spark运行环境的安装 经验

Spark功能还是蛮强的,安装的东西可是不少,好在搞完一次就可以一直用(除非用不上)。这里介绍安装需要的软件和步骤。不同机器可能还有些设置不一样的,需要自己去摸索,毕竟这个是开源软件,好事是有问题可以

jopen 2015-06-25   207580   0

Spark SQL性能优化 经验

性能优化参数 针对Spark SQL 性能调优参数如下: 代码示例 import java.util.List; import org.apache.spark.SparkConf; import org

jopen 2015-06-17   60968   0

Spark的编译 经验

html 由于Spark的运行环境的多样性,如可以运行在hadoop的yarn上,这样就必须要对Spark的源码进行编译。下面介绍一下Spark源码编译的详细步骤: 1、Spark的编译方式:编译的方式可以参考官网:

pdce 2015-06-11   30931   0

Spark性能调优 经验

步骤——性能监控和参数调整,本文主要分享的也是这两方面内容。 性能监控工具 【Spark监控工具】 Spark提供了一些基本的Web监控页面,对于日常监控十分有用。 1. Application

jopen 2015-07-09   45272   0

Spark中的rollup 经验

Spark中的rollup 在对数据进行小计或合计运算时,rollup和cube一样,算是常用的操作了。Spark的DataFrame提供了rollup函数支持此功能。 假设准备了如下数据: trait

jopen 2015-12-31   8013   0

Spark 配置指南 经验

目录 [−] Spark属性 动态加载Spark属性 查看Spark属性 可用的属性 应用属性 运行时环境Runtime Environment Shuffle Behavior Spark UI Compression

jopen 2014-12-11   135978   0

梳理对Spark Standalone的理解 经验

背景 本文不打算从源码分析的角度看standalone如何实现,甚至有的模块和类在分析中都是忽略掉的。 本文目的是透过spark的standalone模式,看类似spark这种执行模式的系统,在设

jopen 2015-02-12   13756   0
P13

  Openfire+Spark+Smack 文档

M来实现。 Spark Smack 和 Openfire 开源界总是有许多有趣的东东,这三个合起来就是一个完整的XMPP IM 实现。包括服务器端——Openfire,客户端——Spark,XMPP

nerv_lee01 2012-05-12   6757   0

Spark与Hadoop之间的PK 资讯

。最近半年来的 Spark 之热就是典型例子。 Spark 是一个基于 RAM 计算的开源码 ComputerCluster 运算系统,目的是更快速地进行数据分析Spark 早期的核心部分代码只有

jopen 2014-12-05   15510   0
Spark  
P72

  Spark + Watson + Twitter 文档

1. Spark + Watson + Twitter DataPalooza SF 2015David Taieb STSM - IBM Cloud Data Services 2. AgendaIntroduction

cpgc 2015-12-14   609   0

两大开源游戏引擎Cocos2d-x及OGEngine对比分析 资讯

展跨平台。两者都由中国公司进行优化和拓展,并受到国 内甚至海外开发者的欢迎。 下面我们就来详细对比下Cocos2d-x和OGEngine。 Cocos2d-x源于支持iOS游戏开发的Cocos2d-iphone;

jopen 2014-08-11   28463   0

Apache Ignite vs Apache Spark 资讯

Ignite 的基于 内存的文件系统和缓存功能 ,我将总结一下我将总结一下 Ignite 和 Spark 的主要区别。我发现这样的问题被重复提出。这很容易回答,因此不必在网上“挖坟”。 显而易见的一个不同就是

jopen 2015-05-12   25902   0
1 2 3 4 5 6 7 8 9 10