Spark介绍 经验

Spark是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用的并行计算框架,Spark基于map reduce算法实现的分布式计算,拥有Hadoop MapReduce所具有的优点;

jopen 2014-11-17   109482   0
P9

  Spark 笔记 文档

Managenment -- 缓存管理,对RDD的中间计算结果进行缓存管理以加快整体的处理速度 计算范式和抽象 Spark首先是一种粗粒度数据并行(data parallel)的计算范式。 数据并行跟任务并行(task

ylx1214 2015-04-18   1526   0
P35

  The Spark Project Today 文档

1. The Spark Project TodayAnd What’s NextAndy Konwinski@andykonwinski 2. Community 3. Project HistorySpark

aacall 2014-06-25   2747   0

Spark 集群概述 经验

com/a/1190000003889102 本篇博客简述 Spark 集群相关的概念。 概述 Spark 的"集群"不是提供运算服务的,而是一种资源分配的调度器。 执行任务的 Spark 进程作为客户端向"集群"申请资源(运算节点)

jopen 2015-10-22   10414   0

Spark运行环境的安装 经验

Spark功能还是蛮强的,安装的东西可是不少,好在搞完一次就可以一直用(除非用不上)。这里介绍安装需要的软件和步骤。不同机器可能还有些设置不一样的,需要自己去摸索,毕竟这个是开源软件,好事是有问题可以

jopen 2015-06-25   207580   0

Spark SQL性能优化 经验

性能优化参数 针对Spark SQL 性能调优参数如下: 代码示例 import java.util.List; import org.apache.spark.SparkConf; import org

jopen 2015-06-17   60968   0

Spark的编译 经验

html 由于Spark的运行环境的多样性,如可以运行在hadoop的yarn上,这样就必须要对Spark的源码进行编译。下面介绍一下Spark源码编译的详细步骤: 1、Spark的编译方式:编译的方式可以参考官网:

pdce 2015-06-11   30931   0

Spark性能调优 经验

步骤——性能监控和参数调整,本文主要分享的也是这两方面内容。 性能监控工具 【Spark监控工具】 Spark提供了一些基本的Web监控页面,对于日常监控十分有用。 1. Application

jopen 2015-07-09   45272   0

Spark中的rollup 经验

Spark中的rollup 在对数据进行小计或合计运算时,rollup和cube一样,算是常用的操作了。Spark的DataFrame提供了rollup函数支持此功能。 假设准备了如下数据: trait

jopen 2015-12-31   8013   0

Spark 配置指南 经验

目录 [−] Spark属性 动态加载Spark属性 查看Spark属性 可用的属性 应用属性 运行时环境Runtime Environment Shuffle Behavior Spark UI Compression

jopen 2014-12-11   135978   0

梳理对Spark Standalone的理解 经验

ne如何实现,甚至有的模块和类在分析中都是忽略掉的。 本文目的是透过spark的standalone模式,看类似spark这种执行模式的系统,在设计和考虑与下次资源管理系统对接的时候,有什么 值得

jopen 2015-02-12   13756   0
P13

  Openfire+Spark+Smack 文档

M来实现。 Spark Smack 和 Openfire 开源界总是有许多有趣的东东,这三个合起来就是一个完整的XMPP IM 实现。包括服务器端——Openfire,客户端——Spark,XMPP

nerv_lee01 2012-05-12   6757   0

Spark与Hadoop之间的PK 资讯

。最近半年来的 Spark 之热就是典型例子。 Spark 是一个基于 RAM 计算的开源码 ComputerCluster 运算系统,目的是更快速地进行数据分析。Spark 早期的核心部分代码只有

jopen 2014-12-05   15510   0
Spark  
P72

  Spark + Watson + Twitter 文档

1. Spark + Watson + Twitter DataPalooza SF 2015David Taieb STSM - IBM Cloud Data Services 2. AgendaIntroduction

cpgc 2015-12-14   609   0

Apache Ignite vs Apache Spark 资讯

Ignite 的基于 内存的文件系统和缓存功能 ,我将总结一下我将总结一下 Ignite 和 Spark 的主要区别。我发现这样的问题被重复提出。这很容易回答,因此不必在网上“挖坟”。 显而易见的一个不同就是

jopen 2015-05-12   25902   0

spark 编程珠玑-RDD 篇 经验

RDD 有关RDD的基础概念请阅读spark官方文档,或网上搜索其他内容。本文完全是实战经验的总结。 惰性求值 RDD的转换操作都是惰性求值的。 惰性求值意味着我们对RDD调用转化操做(例

jopen 2016-01-18   9409   0
P30

  Spark SQL 漫谈 文档

1. Spark SQL 漫谈Cheng Hao Oct 25, 2014Copyright © 2014 Intel Corporation. 2. AgendaSpark SQL Overview

nn34 2014-12-16   535   0

Java Web 框架:Spark 经验

Spark是一个受Sinatra启发的小型Web应用开发的Java框架。 这个例子显示了一些基本的功能: import static spark.Spark.*; import spark.Request;

jopen 2013-11-22   25756   0
P11

  spark-streaming编程指南 文档

Spark Streaming编程指南 Overview Spark Streaming属于Spark的核心api,它支持高吞吐量、支持容错的实时流数据处理。 它可以接受来自Kafka, Flume

1909023453 2017-03-13   5013   0
P227

  spark学习笔记 文档

SPARK 学习笔记 Spark亚太研究院群集体成员 2014/12/9 shanghai-pd Spark 学习笔记 1 1 序 14 2 Spark学习阶段篇 14 2.1 Scala语言 14

larruping 2017-01-03   1040   0
方案   报告   Apache   Basic   diff  
1 2 3 4 5 6 7 8 9 10