开源项目,开源代码,开源文档,开源新闻,开源社区

P9

内部公开▲ Jdbc与hibernate对比测试及优化 1. 测试环境数据库服务器：Xeon 1.6G x 2，8G 内存数据库：Oracle 数据库表：资源信息表；资源子表表结构如下：其中资源信息表中在NEID上创建了索引

happy11wd 2010-12-15 3161 0

Hibernate 持久层框架

P8

FindBugs、PMD和CheckStyle对比 1. 概要工具目的检查项 FindBugs 检查.class 基于Bug Patterns概念，查找javabytecode（.class文件）中的潜在bug

xiaomei 2011-11-21 612 0

代码分析/审查/优化

改进，如Pig，Cascading，JAQL，OOzie，Tez，Spark等。 Apache SparkApache Spark是一个新兴的大数据处理的引擎，主要特点是提供了一个集群的分布式内存抽象，以支持需要工作集的应用。

jopen 2015-11-21 34595 0

Hadoop

9789 二、Spark1.5.1安装 1.下载spark1.5.1 http://spark.apache.org/downloads.html 选择spark的版本 [hado

gotogether 2016-01-27 16758 0

分布式/云计算/大数据

基本概念和原则首先，要搞清楚Spark的几个基本概念和原则，否则系统的性能调优无从谈起：每一台host上面可以并行N个worker，每一个worker下面可以并行M个executor，ta

jopen 2016-01-19 77909 0

Spark 分布式/云计算/大数据

IT 列车的两个车轮,相辅相成,高速发展。如果我们将大数据处理平台比作一个可能会得病的人的话，那么日志分析系统就是给病人诊断的医生。由于集群甚大，几百台机器都是起步价，甚至可能会有上千台、上万台机器同时协

b4zc51o3 2016-11-08 16819 0

Spark Logstash 分布式/云计算/大数据

P15

What is Spark? Spark是一个快速和通用的引擎用于处理大规模的数据量。快速：运行在内存中比HadoopMapReduce快100倍，运行在硬盘上比HadoopMapReduce快10倍。

因为一哥 2018-01-17 536 0

机器学习

本文尝试从源码层面梳理Spark在任务调度与资源分配上的做法。先从Executor和SchedulerBackend说起。Executor是真正执行任务的进程，本身拥有若

jopen 2015-01-16 45286 0

Spark 分布式/云计算/大数据

Spark中最核心的概念为 RDD（Resilient Distributed DataSets）中文为：弹性分布式数据集，RDD为对分布式内存对象的抽象它表示一个被分区不可变且能并行操作

jopen 2016-01-09 8296 0

Spark 分布式/云计算/大数据

P19

1. Spark简介—by 球哥 2. 大数据学习网介绍我们的网址是：bigdatastudy.cn 我们提供专业的大数据学习视频，包括Hadoop，Spark，Storm，Mahout，机器学习等。

ngn6 2015-08-12 775 0

分布式/云计算/大数据 Apache Java JSON Python

P9

1. Openfire+Spark 2. Openfire服务器的介绍 Openfire是用Java语言编写的，是基于XMPP协议、开源的实时协作的服务器，具有跨平台的能力。它是实现XMPP协议的S

super_lgj 2012-08-14 796 0

电话/通讯/IM聊天 Java XML

Spark开发指南简介总的来说，每一个Spark应用程序，都是由一个驱动程序组成，它运行用户的main函数，并且在一个集群上执行各种各样的并行操作。Spark提供的主要的抽象（概念）是一个弹性

jopen 2014-08-24 162840 0

Spark 分布式/云计算/大数据

Apache Spark 的设计与实现，重点关注其设计思想、运行原理、实现架构及性能调优，附带讨论与 Hadoop MapReduce 在设计与实现上的区别。不喜欢将该文档称之为“源码分析”，因为本文的

jopen 2015-07-16 23039 0

分布式/云计算/大数据 Apache Spark

下面这些关于Spark的性能调优项，有的是来自官方的，有的是来自别的的工程师，有的则是我自己总结的。 Data Serialization，默认使用的是Java Serialization，这个程

jopen 2015-12-21 21259 0

Spark 分布式/云计算/大数据

http://www.cnblogs.com/francisYoung/p/5205420.html 要想明白spark application调度机制，需要回答一下几个问题： 1.谁来调度？ 2.为谁调度？

NorineXGII 2016-02-21 10869 0

Spark 分布式/云计算/大数据

来自： http://www.solinx.co/archives/570 Spark执行不少操作时都依赖于闭包函数的调用，此时如果闭包函数使用到了外部变量驱动程序在使用行动操作时传递到集群中

gy471150 2016-02-27 12450 0

Spark 分布式/云计算/大数据

在YARN 上运行 Spark 在Spark0.6.0 版本开始支持 YARN 模式，随后的版本在逐渐地完善。在YARN 上启动 Spark 确保HADOOP_CONF_DIR或YARN_C

jopen 2016-01-08 22741 0

YARN Spark 分布式/云计算/大数据

链接： http://spark.apache.org/docs/latest/programming-guide.html 安装好Spark 后，自带了一些demo, 路径在Spark根目录/exam

lianzhu3 2016-03-01 39966 0

Spark

Spark可以直接对HDFS进行数据的读写，同样支持Spark on YARN。Spark可以与MapReduce运行于同集群中，共享存储资源与计算，数据仓库Shark实现上借用Hive，几乎与Hive完全兼容。

jopen 2014-09-23 100810 0

Spark Hadoop 分布式/云计算/大数据

个人理解首先， MapReduce-like 是说架构上和多数分布式计算框架类似， Spark 有分配任务的主节点（ Driver ）和执行计算的工作节点（ Worker ）

jopen 2014-03-31 32227 0

分布式/云计算/大数据 Spark

Jdbc与hibernate对比测试及优化文档

FindBugs、PMD和CheckStyle对比文档

Hadoop VS Spark 资讯

【Spark 1.5.1】安装经验

Spark的性能调优经验

ELK 在 Spark 集群的应用经验

Spark 初识入门文档

Spark的任务调度经验

Spark核心——RDD 经验

(1)Spark简介文档

Openfire+Spark 文档

Spark编程指南经验

Apache Spark 设计与实现经验

Spark的性能调优经验

Spark Application的调度算法经验

Spark——共享变量经验

在YARN上运行Spark 经验

Spark的Python编程示例代码段

Spark与Hadoop的结合经验

Spark 快速理解经验

Flink，Spark Streaming，Storm对比分析的相关搜索

关键词

Jdbc与hibernate对比测试及优化 文档

FindBugs、PMD和CheckStyle对比 文档

Hadoop VS Spark 资讯

【Spark 1.5.1】 安装 经验

Spark的性能调优 经验

ELK 在 Spark 集群的应用 经验

Spark 初识入门 文档

Spark的任务调度 经验

Spark核心——RDD 经验

(1)Spark简介 文档

Openfire+Spark 文档

Spark编程指南 经验

Apache Spark 设计与实现 经验

Spark的性能调优 经验

Spark Application的调度算法 经验

Spark——共享变量 经验

在YARN上运行Spark 经验

Spark的Python编程示例 代码段

Spark与Hadoop的结合 经验

Spark 快速理解 经验

Flink，Spark Streaming，Storm对比分析 的相关搜索

关键词

Jdbc与hibernate对比测试及优化文档

FindBugs、PMD和CheckStyle对比文档

【Spark 1.5.1】安装经验

Spark的性能调优经验

ELK 在 Spark 集群的应用经验

Spark 初识入门文档

Spark的任务调度经验

(1)Spark简介文档

Spark编程指南经验

Apache Spark 设计与实现经验

Spark的性能调优经验

Spark Application的调度算法经验

Spark——共享变量经验

Spark的Python编程示例代码段

Spark与Hadoop的结合经验

Spark 快速理解经验

Flink，Spark Streaming，Storm对比分析的相关搜索