登录
注册
首页
项目
经验
代码
文库
问答
博客
资讯
分布式/云计算/大数据
(共
1277
篇经验)
0
推荐
54K
浏览
Apache Spark介绍及案例展示
2013年年底,我第一次接触到Spark,当时我对Spark所使用的Scala语言产生了较大的兴趣。一段时间后,我做了一个预测泰坦尼克号船上人员生存概率的数据科学项目。事实证明这是一个更深入了解...
Ros62P
9年前
Spark
分布式/云计算/大数据
0
推荐
15K
浏览
hadoop与mysql数据库的那点事
转眼间已经接触了hadoop两周了,从之前的极力排斥到如今的有点喜欢,刚开始被搭建hadoop开发环境搞得几乎要放弃,如今学会了编写小程序,每天都在成长一点挺好的,好好努力,为自己的装备库再填一...
htwoz
9年前
MySQL
Hadoop
分布式/云计算/大数据
0
推荐
50K
浏览
Spark Streaming使用Kafka保证数据零丢失
spark streaming从1.2开始提供了数据的零丢失,想享受这个特性,需要满足如下条件:
bftu0377
9年前
Kafka
Spark Streaming
分布式/云计算/大数据
0
推荐
19K
浏览
基于MapReduce编程模型的图计算框架
(名词约束: 顶点Vertex-图中顶点;节点Process-计算单元节点),目录说明:
Hop36R
9年前
Git
MapReduce
分布式/云计算/大数据
图计算
0
推荐
59K
浏览
在Eclipse上运行Spark(Standalone,Yarn-Client)
我们知道有eclipse的Hadoop插件,能够在eclipse上操作hdfs上的文件和新建mapreduce程序,以及以Run On Hadoop方式运行程序。那么我们可不可以直接在eclip...
ZXF0109521
9年前
Eclipse
Spark
YARN
分布式/云计算/大数据
0
推荐
26K
浏览
如何使用Spark大规模并行构建索引
如何使用Spark大规模并行构建索引:使用Spark构建索引非常简单,因为spark提供了更高级的抽象rdd分布式弹性数据集,相比以前的使用Hadoop的...
toly_me
9年前
分布式/云计算/大数据
0
推荐
26K
浏览
【Akka】Akka应用调研报告
Akka由Scala语言编写的分布式应用框架,用于简化编写容错的、高可伸缩性的Java和Scala的Actor模型应用。它已经成功运用在电信行业。系统几乎不会宕机(高可用性 99.9999999...
wyjqh
9年前
AKKA
分布式/云计算/大数据
0
推荐
44K
浏览
大数据架构概览
Big Data非常复杂,涉及到的技术繁多。我们常“耳闻”的技术,如果MapReduce, Hadoop等处于哪一层次,下图会给你一个整体印象。
PattiMaes
9年前
NOSQL
MapReduce
大数据
分布式/云计算/大数据
0
推荐
7K
浏览
NFS介绍和安装
dispatch_async和dispatch_sync方法需要传2个参数,第一个参数是队列类型,第二个参数是block块。dispatch_sync:同步当前调用此gcd的线程,会阻塞当前调用...
at2zp5uit0
9年前
分布式/云计算/大数据
0
推荐
15K
浏览
Spark Tungsten-sort Based Shuffle 分析
Tungsten-sort 算不得一个全新的shuffle 方案,它在特定场景下基于类似现有的Sort Based Shuffle处理流程,对内存/CPU/Cache使用做了非常大的优化。带来高...
961408017
9年前
Spark
分布式/云计算/大数据
0
推荐
19K
浏览
Yahoo的流计算引擎基准测试
雅虎Storm团队排名不分先后 ) Sanket Chintapalli , Derek Dagit , Bobby Evans , Reza Farivar , Tom Grave...
ft852704
9年前
Redis
Kafka
分布式/云计算/大数据
0
推荐
41K
浏览
0x0F 大数据职位,数据场技能(下)
摘要:成为数据极客,建立自己的数据场需要哪些技能呢?遇到普通的数据,通过SQL做分析。如果数据量比较大,可以使用Hadoop等大数据框架处理。在深入挖掘上,可用Python或者R语言进行编程。0...
ersm3365
9年前
分布式/云计算/大数据
0
推荐
16K
浏览
0x0E 大数据职位,数据场技能(上)
摘要:除了报表统计外,还需要对数据的有很强的解读能力。电商中的个性推荐技术,商业与银行中的欺骗检测,智能手机中语音识别等等技术,让我们浑身便散发出大数据与机器学习的各种场信息,给人以满满的正能量...
gptqw89y
9年前
分布式/云计算/大数据
0
推荐
11K
浏览
EasyNAS - 存储管理系统
EasyNAS是一个适用于家庭及小型办公环境的存储管理系统。 它使用Opensuse的文件系统BTRFS: 具有稳定,高性能,高可用和其他你不常见的特性。 EasyNAS的先进特性包括:支持压缩...
dampire
9年前
存储系统
分布式/云计算/大数据
0
推荐
11K
浏览
【hadoop 2.7.1 】动态添加节点、删除节点
【hadoop 2.7.1 】动态添加节点、删除节点:hftest0001 hftest0002 hftest0003 一、动态添加节点 hftest0001 (master node ) [h...
SharonHarde
9年前
分布式/云计算/大数据
0
推荐
18K
浏览
nono-task-dispatcher - 基于zookeeper的分布式定时任务调度系统
nono-task-dispatcher - 基于zookeeper的分布式定时任务调度系统
jopen
9年前
分布式/云计算/大数据
nono-task-dispatcher
0
推荐
45K
浏览
Hadoop2.6.0上的spark1.5.2集群搭建
Hadoop2.6.0上的spark1.5.2集群搭建:一、Spark安装前提 安装Spark之前需要先安装Hadoop集群,因为之前已经安装了hadoop,所以我直接在之前的...
yvdyyn805
9年前
分布式/云计算/大数据
0
推荐
17K
浏览
【Spark 1.5.1】 安装
【Spark 1.5.1】 安装:一、Hadoop 2.x 安装 Hadoop 2.x安装 http://my.oschina.net/u/204498/blog/519789 二、Spark1...
gotogether
9年前
分布式/云计算/大数据
0
推荐
48K
浏览
zookeeper入门基本介绍
在给大家介绍ZooKeeper之前先来给大家介绍一种技术——分布式协调技术。那么什么是分布式协调技术?那么我来告诉大家,其实分布式协调技术主要用来解决分布式环境当中多个进程之间的同步控制,让他们...
gmge6769
9年前
分布式/云计算/大数据
0
推荐
21K
浏览
hadoop2.6.3 集群部署
hadoop2.6.3 集群部署
StevenGrey
9年前
分布式/云计算/大数据
1
2
3
4
5
6
7
8
9
10
经验分享,提升职场影响力
投稿
热门问答
热门文档