开源项目,开源代码,开源文档,开源新闻,开源社区

http://ifeve.com/《spark官方文档》集群模式概览/ 集群模式概览本文简要描述了Spark在集群中各个组件如何运行。想了解如何在集群中启动Spark应用，请参考 application

fyfg0690 2016-02-28 9942 0

Spark 分布式/云计算/大数据

新开发的大部分项目都是基于Spark和Spark MLLib的，对于一些被大家广泛使用而Spark并不具备的工具和类库Collective还专门创建了一个扩展库 Spark Ext 。在本文中，Eugene

jopen 2015-11-20 9798 0

Spark ML

儿我就结合我这几年在 Hadoop 等大数据方向的工作经验，与大家讨论一下 Hadoop 、 Spark 、 HBase 及 Redis 等几个主流大数据技术的使用场景（首先声明一点，本文中所指的 Hadoop

jopen 2014-08-08 34361 0

Hadoop Spark HBase Redis 分布式/云计算/大数据

图片声音资料路径 1.修改字体：各个界面类中改11为12 org.jivesoftware--Spark.java--installBaseUIProperties()--setApplicationFont(new

xilong008 2013-06-26 58050 0

电话/通讯/IM聊天开源，im，spark Openfire

Spark 是谷歌公司推出的一款基于 Chrome 浏览器的开发环境。提供一组可重用的 UI 组件。采用 Dart 开发。安装方法请看： https://github.com/dart-la

jopen 2013-11-21 21316 0

Spark Web开发工具

在这篇文章中，我将介绍一下 Spark SQL对Json的支持，这个特性是Databricks的开发者们的努力结果，它的目的就是在 Spark 中使得查询和创建JSON数据变得非常地简单。随着WEB和

jopen 2015-02-04 71241 0

Spark SQL 分布式/云计算/大数据

发现了一个好用的工具，那就是Spark中的MLlib。解决方法-MLlib Spark是近年来非常流行的一种分散式运算的系统，MLlib是它提供的套件之一。MLlib是机器学习的函式库，其中提供了许多演算法，如

jopen 2015-02-11 20695 0

分布式/云计算/大数据 Apache Spark

背景 Spark on Yarn分yarn-cluster和yarn-client两种模式。本文通过Cluster模式的TaskScheduler实现入手，梳理一遍spark on yarn的大致实现逻辑。

c6g3 2015-02-15 40450 0

Spark 分布式/云计算/大数据

RDD是什么？ RDD是Spark中的抽象数据结构类型，任何数据在Spark中都被表示为RDD。从编程的角度来看，RDD可以简单看成是一个数组。和普通数组的区别是，RDD中的数据是分区存储的，这

jopen 2015-03-21 37683 0

Spark 分布式/云计算/大数据

本文主要记录最近一段时间学习和实现Spark MLlib中的协同过滤的一些总结，希望对大家熟悉Spark ALS算法有所帮助。更新：【2016.06.12】Spark1.4.0中MatrixFa

jopen 2015-07-29 72900 0

Spark 分布式/云计算/大数据

什么是Spark Apache Spark 是一个围绕速度、易用性和复杂分析构建的大数据处理框架。最初在2009年由加州大学伯克利分校的AMPLab开发，并于2010年成为Apache的开源项目之一。

jopen 2015-11-16 61047 0

分布式/云计算/大数据 Apache Spark

使用Docker在本地搭建hadoop，spark集群简介和环境说明本环境使用的单个宿主主机，而不是跨主机集群，本spark集群环境存在的意义可能在于便于本地开发测试使用，非常轻量级和便捷。这

jopen 2016-01-06 19262 0

Docker Hadoop Spark 分布式/云计算/大数据

来自： https://community.qingcloud.com/topic/341/spark-tungsten-sort-based-shuffle-分析 Tungsten-sort 算不得一个全新的shuffle

961408017 2016-01-31 14769 0

Spark 分布式/云计算/大数据

Spark是一个微型的Java Web框架，它的灵感来自于Sinatra，它的目的是让你以最小的代价创建出一个Java Web应用。示例代码： import static spark.Spark

fmms 2011-12-11 22938 0

Java Web框架

Spark是一个开源，跨平台IM客户端。它的特性支持集组聊天，电话集成和强大安全性能。如果企业内部部署IM使用Openfire+Spark是最佳的组合。 Open Source File Transfer

jopen 2011-12-19 81849 0

Java 电话/通讯/IM聊天

8/2824889 当下，Spark已经在国内得到了广泛的认可和支持：2014年，Spark Summit China在北京召开，场面火爆；同年，Spark Meetup在北京、上海、深圳和杭

jopen 2015-06-08 49372 0

Hadoop 分布式/云计算/大数据

Spark是近年来发展较快的分布式并行数据处理框架，可以与Hadoop联合使用，增强Hadoop的性能。同时，Spark还增加了内存缓存、流数据处理、图数据处理等更为高级的数据处理能力。这里简单介绍了

jopen 2015-06-25 53456 0

Spark 分布式/云计算/大数据

概述 Apache Spark的高性能一定程度上取决于它采用的异步并发模型（这里指server/driver端采用的模型），这与Hadoop 2.0（包括YARN和MapReduce）是一致的。Hadoop

jopen 2016-01-08 10239 0

Spark Hadoop 分布式/云计算/大数据

http://my.oschina.net/sulliy/blog/617259 本文介绍Spark的RDD。作为一个概念，RDD本身是与编程语言无关的，你即可以用Scala实现，也可以是Java

U4dbsfaasa 2016-02-18 8415 0

分布式/云计算/大数据

本文使用Scala2.10.6，sbt。请自行提前装好。设置SSH，本地免密码登录因为Spark master需要ssh到Spark worker中执行命令，所以，需要免密码登录。 cat ~/.ssh/id

daidai141 2016-01-26 12715 0

Spark 分布式/云计算/大数据

《Spark官方文档》集群模式概览经验

Collective的Spark ML经验分享：读者模型资讯

Hadoop、Spark、HBase与Redis的适用性讨论（全文）经验

spark部分代码分析，修改笔记经验

基于 Chrome App 的开发工具：Spark 经验

Spark SQL中对Json支持的详细介绍经验

最夯的大数据分析工具-Apache Spark 经验

Spark on Yarn: Cluster模式Scheduler实现经验

Spark RDD API详解(一) Map和Reduce 经验

如何使用Spark ALS实现协同过滤经验

大数据处理框架Apache Spark入门经验

使用Docker在本地搭建hadoop，spark集群经验

Spark Tungsten-sort Based Shuffle 分析经验

微型的Java Web框架 Spark 经验

基于Java的IM客户端 Spark IM 经验

从Hadoop到Spark的架构实践经验

关于Spark的基本概念和特性简介经验

Hadoop和Spark的处理模型比较经验

Spark核心概念RDD（Resilient Distributed Datasets）经验

Spark本地开发环境搭建经验

Spark MLLib 的相关搜索

关键词

《Spark官方文档》集群模式概览 经验

Collective的Spark ML经验分享：读者模型 资讯

Hadoop、Spark、HBase与Redis的适用性讨论（全文） 经验

spark部分代码分析，修改笔记 经验

基于 Chrome App 的开发工具：Spark 经验

Spark SQL中对Json支持的详细介绍 经验

最夯的大数据分析工具-Apache Spark 经验

Spark on Yarn: Cluster模式Scheduler实现 经验

Spark RDD API详解(一) Map和Reduce 经验

如何使用Spark ALS实现协同过滤 经验

大数据处理框架Apache Spark入门 经验

使用Docker在本地搭建hadoop，spark集群 经验

Spark Tungsten-sort Based Shuffle 分析 经验

微型的Java Web框架 Spark 经验

基于Java的IM客户端 Spark IM 经验

从Hadoop到Spark的架构实践 经验

关于Spark的基本概念和特性简介 经验

Hadoop和Spark的处理模型比较 经验

Spark核心概念RDD（Resilient Distributed Datasets） 经验

Spark本地开发环境搭建 经验

Spark MLLib 的相关搜索

关键词

《Spark官方文档》集群模式概览经验

Collective的Spark ML经验分享：读者模型资讯

Hadoop、Spark、HBase与Redis的适用性讨论（全文）经验

spark部分代码分析，修改笔记经验

Spark SQL中对Json支持的详细介绍经验

Spark on Yarn: Cluster模式Scheduler实现经验

如何使用Spark ALS实现协同过滤经验

大数据处理框架Apache Spark入门经验

使用Docker在本地搭建hadoop，spark集群经验

Spark Tungsten-sort Based Shuffle 分析经验

从Hadoop到Spark的架构实践经验

关于Spark的基本概念和特性简介经验

Hadoop和Spark的处理模型比较经验

Spark核心概念RDD（Resilient Distributed Datasets）经验

Spark本地开发环境搭建经验