Apache Spark 1.6 预览版:更简便的搜索

日前,Databricks公司发布了一个Apache Spark主要版本的可用性。除了可用性、可移植性等几个新的特性外,本次发布还提供了对尚未发布的Apache Spark 1.6预览。 Dat...
jopen 9年前    16391   

大数据处理框架,Apache Spark 1.5.2 发布

Apache Spark 1.5.2 发布,此版本是个维护版本,包括 Spark 一些领域的稳定性修复,主要是:DataFrame API, Spark Streaming, PySpark, ...
jopen 9年前    21282   

Apache Spark 1.5新特性介绍

Apache Spark社区刚刚发布了 1.5 版本,大家一定想知道这个版本的主要变化,这篇文章告诉你答案。
jopen 9年前    23843   

Apache Spark 1.5.0正式发布

Spark 1.5.0 是 1.x 系列的第六个版本,包括 230+ 贡献者的努力。
jopen 9年前    22147   

Apache Spark不过时的六大理由

在极短的时间内,Apache Spark 迅速成长为大数据分析的技术核心。这就使得保守派担心在这个技术更新如此之快的年代它是否会同样快的被淘汰呢。我反而却坚信,spark 仅仅是崭露头角。
jopen 9年前    14607   

Apache Spark 1.4.1 发布,开源集群计算系统

Apache Spark 1.4.1 发布,此版本是个维护版本,包括一些稳定性修复(DataFrame API, Spark Streaming, PySpark, Spark SQL 和 ML...
jopen 9年前    20371   

IBM 想要通过 Apache Spark 影响百万工程师

6月15日消息,IBM今日宣布了一系列Apache Spark开源软件相关的措施,旨在更好地存储、处理以及分析大量不同类型的数据。
nw44 9年前    15693   

Apache Spark 1.4 发布,开源集群计算系统

Apache Spark 是一种与 Hadoop 相似的开源集群计算环境,但是两者之间还存在一些不同之处,这些有用的不同之处使 Spark 在某些工作负载方面表现得更加优越,换句话说,Spark...
jopen 9年前    16817   

Apache Ignite vs Apache Spark

出于我前面的贴子大赞了 Apache Ignite 的基于内存的文件系统和缓存功能,我将总结一下我将总结一下 Ignite 和 Spark 的主要区别。我发现这样的问题被重复提出。这很容易回答,...
jopen 9年前    25902   

Apache Spark 的持续增长

这周,快速发展的Apache Spark社区在纽约聚集,为了庆祝成为当今最受欢迎的开源项目之一。 2009年,Spark项目在UC伯克利的AMPLab启动,在过去的一年半里,Apache Sp...
jopen 10年前    19475   

Apache Spark 1.3发布,新增Data Frames API,改进Spark SQL和MLlib

Apache Spark项目刚刚 发布了1.3版本 。该版本主要的功能改进包括新增DataFrames API,更加成熟的Spark SQL,机器学习库MLlib中新增的大量方法以及更好地整...
jopen 10年前    23841   

Apache Spark 1.3 发布,基于内存计算的开源的集群计算系统

Apache Spark 1.3 发布,1.3 版本引入了期待已久的 DataFrame API,这是 Spark 的 RDD 抽象设计来简单快速支持大数据集的变革。同时在流转换 ML 和 SQL 的大量提升。
f663x 10年前    27556   

Apache Spark 1.2.0发布:引入基于Netty的实现,支持高可用,并提供机器学习API

Apache Spark 1.2.0已经发布,Spark核心引擎在性能和可用性方面都有很大改进。这是来自60多家研究机构和公司的172位贡献者的成果,包括了1000多个补丁。
jopen 10年前    22324   

热门问答

热门文档