开源项目,开源代码,开源文档,开源新闻,开源社区

属于商业运营产品，而 ELK 属于开源产品。本文着重讨论 ELK 方案，并详细阐述 ELK 如何应用到 Spark 集群中。事实上，ELK 官方已称之为 Elastic,考虑行业内对此系统已经熟识，故而继续延用

b4zc51o3 2016-11-08 16819 0

Spark Logstash 分布式/云计算/大数据

P15

What is Spark? Spark是一个快速和通用的引擎用于处理大规模的数据量。快速：运行在内存中比HadoopMapReduce快100倍，运行在硬盘上比HadoopMapReduce快10倍。

因为一哥 2018-01-17 536 0

机器学习

本文尝试从源码层面梳理Spark在任务调度与资源分配上的做法。先从Executor和SchedulerBackend说起。Executor是真正执行任务的进程，本身拥有若

jopen 2015-01-16 45286 0

Spark 分布式/云计算/大数据

Spark中最核心的概念为 RDD（Resilient Distributed DataSets）中文为：弹性分布式数据集，RDD为对分布式内存对象的抽象它表示一个被分区不可变且能并行操作

jopen 2016-01-09 8296 0

Spark 分布式/云计算/大数据

P19

1. Spark简介—by 球哥 2. 大数据学习网介绍我们的网址是：bigdatastudy.cn 我们提供专业的大数据学习视频，包括Hadoop，Spark，Storm，Mahout，机器学习等。

ngn6 2015-08-12 775 0

分布式/云计算/大数据 Apache Java JSON Python

P49

1. Deep dive into Spark Streaming Tathagata Das (TD) Matei Zaharia, Haoyuan Li, Timothy Hunter, Patrick

fkd27 2015-10-17 545 0

分布式/云计算/大数据 Java Python Scala

P9

1. Openfire+Spark 2. Openfire服务器的介绍 Openfire是用Java语言编写的，是基于XMPP协议、开源的实时协作的服务器，具有跨平台的能力。它是实现XMPP协议的S

super_lgj 2012-08-14 796 0

电话/通讯/IM聊天 Java XML

Spark开发指南简介总的来说，每一个Spark应用程序，都是由一个驱动程序组成，它运行用户的main函数，并且在一个集群上执行各种各样的并行操作。Spark提供的主要的抽象（概念）是一个弹性

jopen 2014-08-24 162840 0

Spark 分布式/云计算/大数据

文主要讨论 Apache Spark 的设计与实现，重点关注其设计思想、运行原理、实现架构及性能调优，附带讨论与 Hadoop MapReduce 在设计与实现上的区别。不喜欢将该文档称之为“源码分析

jopen 2015-07-16 23039 0

分布式/云计算/大数据 Apache Spark

下面这些关于Spark的性能调优项，有的是来自官方的，有的是来自别的的工程师，有的则是我自己总结的。 Data Serialization，默认使用的是Java Serialization，这个程

jopen 2015-12-21 21259 0

Spark 分布式/云计算/大数据

http://www.cnblogs.com/francisYoung/p/5205420.html 要想明白spark application调度机制，需要回答一下几个问题： 1.谁来调度？ 2.为谁调度？

NorineXGII 2016-02-21 10869 0

Spark 分布式/云计算/大数据

来自： http://www.solinx.co/archives/570 Spark执行不少操作时都依赖于闭包函数的调用，此时如果闭包函数使用到了外部变量驱动程序在使用行动操作时传递到集群中

gy471150 2016-02-27 12450 0

Spark 分布式/云计算/大数据

在YARN 上运行 Spark 在Spark0.6.0 版本开始支持 YARN 模式，随后的版本在逐渐地完善。在YARN 上启动 Spark 确保HADOOP_CONF_DIR或YARN_C

jopen 2016-01-08 22741 0

YARN Spark 分布式/云计算/大数据

链接： http://spark.apache.org/docs/latest/programming-guide.html 安装好Spark 后，自带了一些demo, 路径在Spark根目录/exam

lianzhu3 2016-03-01 39966 0

Spark

Spark可以直接对HDFS进行数据的读写，同样支持Spark on YARN。Spark可以与MapReduce运行于同集群中，共享存储资源与计算，数据仓库Shark实现上借用Hive，几乎与Hive完全兼容。

jopen 2014-09-23 100810 0

Spark Hadoop 分布式/云计算/大数据

个人理解首先， MapReduce-like 是说架构上和多数分布式计算框架类似， Spark 有分配任务的主节点（ Driver ）和执行计算的工作节点（ Worker ）

jopen 2014-03-31 32227 0

分布式/云计算/大数据 Spark

Spark是一个基于内存计算的开源的集群计算系统，目的是让数据分析更加快速。Spark非常小巧玲珑，由加州伯克利大学AMP实验室的Matei为主的小团队所开发。使用的语言是Scala，项目的core部

jopen 2014-08-14 51313 0

分布式/云计算/大数据 Spark

Spark SQL 编程指南简介 Spark SQL支持在Spark中执行SQL，或者HiveQL的关系查询表达式。它的核心组件是一个新增的RDD类型JavaSchemaRDD。JavaSche

jopen 2014-09-01 93150 0

Spark 分布式/云计算/大数据

Spark 基于内存计算，提高了在大数据环境下数据处理的实时性，同时保证了高容错性和高可伸缩性，允许用户将Spark 部署在大量廉价硬件之上，形成集群。认识 Spark Apache Spark

jopen 2015-01-13 58340 0

Spark 分布式/云计算/大数据

1、Spark介绍 Spark是起源于美国加州大学伯克利分校AMPLab的大数据计算平台，在2010年开源，目前是Apache软件基金会的顶级项目。随着Spark在大数据计算领域的暂露头角，越来越

jopen 2015-01-29 28746 0

Spark 分布式/云计算/大数据

ELK 在 Spark 集群的应用经验

Spark 初识入门文档

Spark的任务调度经验

Spark核心——RDD 经验

(1)Spark简介文档

Deep dive into Spark Streaming 文档

Openfire+Spark 文档

Spark编程指南经验

Apache Spark 设计与实现经验

Spark的性能调优经验

Spark Application的调度算法经验

Spark——共享变量经验

在YARN上运行Spark 经验

Spark的Python编程示例代码段

Spark与Hadoop的结合经验

Spark 快速理解经验

什么是spark 经验

Spark SQL编程指南经验

Spark初探经验

Spark 内核研究经验

Spark MLLib 的相关搜索

关键词

ELK 在 Spark 集群的应用 经验

Spark 初识入门 文档

Spark的任务调度 经验

Spark核心——RDD 经验

(1)Spark简介 文档

Deep dive into Spark Streaming 文档

Openfire+Spark 文档

Spark编程指南 经验

Apache Spark 设计与实现 经验

Spark的性能调优 经验

Spark Application的调度算法 经验

Spark——共享变量 经验

在YARN上运行Spark 经验

Spark的Python编程示例 代码段

Spark与Hadoop的结合 经验

Spark 快速理解 经验

什么是spark 经验

Spark SQL编程指南 经验

Spark初探 经验

Spark 内核研究 经验

Spark MLLib 的相关搜索

关键词

ELK 在 Spark 集群的应用经验

Spark 初识入门文档

Spark的任务调度经验

(1)Spark简介文档

Spark编程指南经验

Apache Spark 设计与实现经验

Spark的性能调优经验

Spark Application的调度算法经验

Spark——共享变量经验

Spark的Python编程示例代码段

Spark与Hadoop的结合经验

Spark 快速理解经验

Spark SQL编程指南经验

Spark初探经验

Spark 内核研究经验