0推荐
61K 浏览

大数据处理框架Apache Spark入门

Apache Spark是一个围绕速度、易用性和复杂分析构建的大数据处理框架。最初在2009年由加州大学伯克利分校的AMPLab开发,并于2010年成为Apache的开源项目之一。
0推荐
17K 浏览

Apache Spark在大规模分布式自然语言处理的应用

我们TripAdvisor公司拥有大量的用户评价数据,据最近的一次公告,大约有几亿条。我是从事机器学习相关的工作,在机器学习中我们常喜欢做的一件事就是堆砌大量数据来分析。
0推荐
20K 浏览

提供程序使用 Apache Spark 的基础:Spark Kernel

Spark Kernel 的最主要目标:提供基础给交互应用程序联系和使用 Apache Spark。
0推荐
23K 浏览

Apache Spark 设计与实现

文主要讨论 Apache Spark 的设计与实现,重点关注其设计思想、运行原理、实现架构及性能调优,附带讨论与 Hadoop MapReduce 在设计与实现上的区别。不喜欢将该文档称之为“源...
0推荐
62K 浏览

Apache Spark入门攻略

本文聚焦Apache Spark入门,了解其在大数据领域的地位,覆盖Apache Spark的安装及应用程序的建立,并解释一些常见的行为和操作。
0推荐
27K 浏览

使用Apache Spark分析豆瓣电影数据

上周在看豆瓣的时候,看到有豆列推荐类似豆瓣250的电影,刚好最近在学Berkeley 的Scalable Machine Learning这门课程,接触了下Spark的基本的操作,然后就想要不然...
0推荐
62K 浏览

用Apache Spark进行大数据处理——第一部分:入门介绍

Apache Spark是一个围绕速度、易用性和复杂分析构建的大数据处理框架。最初在2009年由加州大学伯克利分校的AMPLab开发,并于2010年成为Apache的开源项目之一。 与Hado...
0推荐
21K 浏览

最夯的大数据分析工具-Apache Spark

大家好!我是猫大,大家还记得我的好友咪咪(那位想要知道自己养的猫,会不会抓老鼠的那位爱猫人士)吗?在过去文章什么 ? SVM会赚钱 !中猫大介绍了SVM的概念,以及如何通过LIBSVM,帮助使用...
0推荐
54K 浏览

Apache Spark 的R语言前端:SparkR

SparkR是一个R语言包提供了一个轻量级的前端,用于从R语言中使用Apache Spark。SparkR通过RDD类暴露Spark API,允许用户以交互方式在集群上从 R shell 运行jobs 。

经验分享,提升职场影响力

投稿

热门问答

    热门文档