分布式/云计算/大数据 - 开源经验 - 第13页

0推荐

55K 浏览

在今天的文章中，我们将着重探讨如何利用SMACK（即Spark、Mesos、Akka、Cassandra以及Kafka）堆栈构建可扩展数据处理平台。虽然这套堆栈仅由数个简单部分组成，但其能够实现...

电子天府 9年前

Cassandra Kafka Spark 分布式/云计算/大数据

0推荐

22K 浏览

Spark 1.6发布后，官方声称流式状态管理有10倍性能提升。这篇文章会详细介绍Spark Streaming里新的流式状态管理。

lh880331 9年前

Spark Streaming 分布式/云计算/大数据

0推荐

79K 浏览

这篇文章的目的是帮助您开始使用 Apache Zeppelin Notebook，它可以满足您用R做数据科学的需求。Zeppelin 是一个提供交互数据分析且基于Web的笔记本。方便你做出可数据...

solari 9年前

数据分析 Zeppelin 分布式/云计算/大数据

0推荐

19K 浏览

最近在调整游戏的后台架构，之前因为需要快速出产品，所以整个代码都揉成一团，也基本没有做任何分层处理。现在服务器端的开发也开始逐渐招进来，所以打算打算换一套统一的架构，以后做新游戏只要做其中的业务逻辑即可。

udzw3018 9年前

Redis RabbitMQ 分布式系统分布式/云计算/大数据

0推荐

9K 浏览

之前有说过要设计一个工作流调度器。开发一个完善的工作流调度器应该并不是一件简单的事情。但是通过Spark Streaming(基于Transfomer架构的理念)，我们可能能简化这些工作。我在这...

jxjy1403 9年前

工作流 Spark Streaming 分布式/云计算/大数据

0推荐

10K 浏览

storm集群和单点安装：Storm实时分析平台的起源，Storm分布式集群实施流式处理场景：算法交易 storm组件 1.nimbus集群中心，控...

lnmz3156 9年前

分布式/云计算/大数据

0推荐

7K 浏览

Zookeeper配置项说明：Zookeeper常见基本配置项： tickTime: CS通信心跳 initLimit: LF初始通信时限 syncLimit: LF同步通信...

omaster 9年前

分布式/云计算/大数据

0推荐

9K 浏览

Storm集群的搭建：在Ubuntu 14.04下搭建Storm集群环境 Step 1. 下载所需的软件包： 1). JDK: http://www.oracle.com/tec...

wangyifeiy 9年前

分布式/云计算/大数据

0推荐

25K 浏览

Rust IDE 构建使用 IntelliJ 平台

KinColon 9年前

开发工具 Rust 分布式/云计算/大数据

0推荐

17K 浏览

Tair是一个高性能、分布式、可扩展、高可靠的NoSQL存储系统。本文基于Tair v3.1.2.43版本，探究其mdb存储引擎的实现。 Tair目前有mdb、ldb和rdb等存储引擎。其中m...

BriBailey 9年前

分布式/云计算/大数据

0推荐

14K 浏览

所谓高可用性指的是系统如何保证比较高的服务可用率，在出现故障时如何应对，包括及时发现、故障转移、尽快从故障中恢复等等。本文主要以点评的交易系统的演进为主来描述如何做到高可用，并结合了一些自己的经...

TylerCoats 9年前

分布式/云计算/大数据高可用性

0推荐

23K 浏览

文章是哥(mephisto)写的，SourceLink 上一篇，我们对hive的数据导出，以及集群Hive数据的迁移进行描述。了解到了基本的hive导出操作。这里，我们将对hive的CL...

ylwp0804 9年前

JDBC Hadoop Hive 分布式/云计算/大数据

0推荐

13K 浏览

插件下载后，放在eclipse安装目录下的plugins文件夹下，然后重启eclipse，就会发现Project Explorer窗口里多出DFS Locations这一项，对应的是HDFS里存...

EmmWakelin 9年前

Eclipse Hadoop 分布式/云计算/大数据

0推荐

12K 浏览

Paxos是一个基于消息传递的一致性算法，近几年被广泛应用于分布式计算中，Google的Chubby，Apache的Zookeeper都是基于它的理论来实现的，Paxos还被认为是到目前为止唯一...

MagaretTall 9年前

分布式/云计算/大数据

0推荐

26K 浏览

To knowledge 是目标，手段还是 mining ，俗称数据民工。每当大家讲到大数据，都会不约而同的提到大数据几个 V 的定义： Volume ， Variety ， Velocity ...

xxxway 9年前

数据挖掘大数据分布式/云计算/大数据

0推荐

27K 浏览

Apache Mesos 是一个分布式系统的管理软件，对集群的资源进行分配和管理。

KindraLefeb 9年前

ZooKeeper Docker 分布式/云计算/大数据

0推荐

14K 浏览

在平常的高并发的程序中，为了保证数据的一致性，因此都会用到锁，来对当前的线程进行锁定。在单机操作中，很好做到，比如可以采用Synchronized、Lock或者其他的读写多来锁定当前的线程。但...

casonstart 9年前

分布式/云计算/大数据

0推荐

12K 浏览

组件分布在网络计算机上组件之间仅仅通过消息传递来通信并协调行动分布式系统的意义：升级单机处理能力的性价比根据摩尔定律来说，如果把时间固定下来，所需要的处理器性能越高，付出的...

lgh01b5d32ds 9年前

负载均衡分布式系统分布式/云计算/大数据

0推荐

17K 浏览

我们基于Hadoop 1.2.1源码分析MapReduce V1的处理流程。

jdbz8397 9年前

MapReduce 分布式/云计算/大数据

0推荐

23K 浏览

storm拓扑的并行度(parallelism)概念：1 storm并行的基本概念一个运行中的拓扑是由什么构成的：工作进程（worker processes），执行器（execu...

MillieSpurl 9年前

分布式/云计算/大数据

数据处理平台架构中的SMACK组合：Spark、Mesos、Akka、Cassandra以及Kafka

Spark Streaming 1.6 流式状态管理分析

【译】大数据分析平台搭建教程：基于Apache Zeppelin Notebook和R的交互式数据科学

分布式消息系统尝试(rabbitmq, celery, redis)

Spark Streaming 妙用之实现工作流调度器

storm集群和单点安装

Zookeeper配置项说明

Storm集群的搭建

Rust IDE 构建使用 IntelliJ 平台

Tair mdb 存储引擎的实现

高可用性系统在大众点评的实践与经验

从零自学Hadoop(18)：Hive的CLI和JDBC

Hadoop2.6.2的Eclipse插件的使用

Zookeeper的Paxos分布式一致性算法-类比的方式去理解

浅谈大数据应用研究的3个V

Docker系列之（二）：使用Mesos管理Docker集群（Mesos + Marathon + Chronos + Docker）

zookeeper应用场景练习（分布式锁）

分布式系统介绍

MapReduce V1：MapTask执行流程分析

storm拓扑的并行度(parallelism)概念

热门问答

热门文档