登录
注册
首页
项目
经验
代码
文库
问答
博客
资讯
分布式/云计算/大数据
(共
1277
篇经验)
0
推荐
14K
浏览
storm集群搭建
storm集群搭建:集群环境:每台机器的操作系统,配置都要一样的,避免一些不必要的麻烦, 所需工具软件:python,zookeepe...
jopen
9年前
分布式/云计算/大数据
0
推荐
51K
浏览
Spark 常见问题小结
Spark 常见问题小结:Spark is an excellent tool to use with Apache Cassandra and thanks to the DataStax O...
jopen
9年前
分布式/云计算/大数据
0
推荐
8K
浏览
Spark中的rollup
在对数据进行小计或合计运算时,rollup和cube一样,算是常用的操作了。Spark的DataFrame提供了rollup函数支持此功能。
jopen
9年前
分布式/云计算/大数据
0
推荐
6K
浏览
如何在分布式、可伸缩环境中保护你的秘密?
去年十月份,在阿姆斯特丹 速度会议 上,来自 Fugue的首席安全工程师 Alex Schoof 解释 了如何在一个分布式、可伸缩的环境中管理秘密,比如云平台。Schoof提议将秘密管理系统分解...
jopen
9年前
分布式系统
分布式/云计算/大数据
0
推荐
17K
浏览
使用Docker建立一个动态负载平衡的分布式Web系统
这是一个使用Docker将Node.JS或Java等Web应用实现 分布式 部署的文章,关键是解决应用服务的自动发现。
jopen
9年前
HAproxy
Docker
Linux命令
分布式/云计算/大数据
0
推荐
7K
浏览
ceph集群配置注意事项
ceph集群配置注意事项:ceph部署环境: 硬件环境。4台4U的服务器,服务器配置信息如下:
jopen
9年前
分布式/云计算/大数据
0
推荐
10K
浏览
hadoop2.7.1环境搭建
hadoop2.7.1环境搭建:在老板的支持下,陆续划拉到了10几台机器,绑定了固定IP,工作之余开始了Hadoop之旅。将要点记录下来,以...
jopen
9年前
分布式/云计算/大数据
0
推荐
14K
浏览
通过demo学习OpenStack开发--API服务(2)
编者按:《通过demo学习OpenStack开发》专栏是刘陈泓的系列文章,专栏通过开发一个demo的形式来介绍一些参与OpenStack项目开发的必要的基础知识,希望帮助大家入门企业级Pytho...
jopen
9年前
API
OpenStack
WSGI
分布式/云计算/大数据
0
推荐
9K
浏览
Hadoop 2.6 + Hive 1.2.1 + spark-1.4.1(3)
Hadoop 2.6 + Hive 1.2.1 + spark-1.4.1(3):1. 新建表 1) 新建表结构 create table user_table( id ...
jopen
9年前
分布式/云计算/大数据
0
推荐
33K
浏览
新一代大数据处理引擎 Apache Flink
这几年大数据的飞速发展,出现了很多热门的开源社区,其中著名的有 Hadoop、Storm,以及后来的 Spark,他们都有着各自专注的应用场景。Spark 掀开了内存计算的先河,也以内存为赌注,...
jopen
9年前
Hadoop
大数据
Apache Flink
分布式/云计算/大数据
0
推荐
10K
浏览
如何使用CloudEndure将Amazon EC2实例从EC2-Classic迁移到Amazon VPC
这是一篇来自AWS企业解决方案架构师David Shurtliff和CloudEndure VP商务开发的Gonen Stein合作的一篇客座文章.
jopen
9年前
Amazon EC2
分布式/云计算/大数据
0
推荐
18K
浏览
通过demo学习OpenStack开发——软件包管理
编者按:《通过demo学习OpenStack开发》专栏是刘陈泓的系列文章,专栏通过开发一个demo的形式来介绍一些参与OpenStack项目开发的必要的基础知识,希望帮助大家入门企业级Pytho...
jopen
9年前
Python
OpenStack
分布式/云计算/大数据
0
推荐
19K
浏览
日志系统之基于Zookeeper的分布式协同设计
最近这段时间在设计和实现日志系统,在整个日志系统系统中Zookeeper的作用非常重要——它用于协调各个分布式组件并提供必要的配置信息和元 数据。这篇文章主要分享一下Zookeeper的使用场景...
jopen
9年前
ZooKeeper
分布式/云计算/大数据
0
推荐
7K
浏览
Meteor的临时的存储:Session
在开发的过程中有的时候我们只需要存储一些临时的变量,我们并不想使用collection来存储,这个时候我们可以使用Session来存储,Session可以方便的存储一些状态,也可以在helper...
jopen
9年前
分布式/云计算/大数据
Session
0
推荐
257K
浏览
Hadoop - Ambari集群管理剖析
Ambari是Apache推出的一个集中管理Hadoop的集群的一个平台,可以快速帮助搭建Hadoop及相关以来组件的平台,管理集群方便。这篇博客记录Ambari的相关问题和注意事项。方便为初学...
jopen
9年前
Hadoop
分布式/云计算/大数据
0
推荐
15K
浏览
ZOOKEEPER基础
ZOOKEEPER基础
jopen
9年前
ZooKeeper
分布式/云计算/大数据
0
推荐
21K
浏览
Spark的性能调优
下面这些关于Spark的性能调优项,有的是来自官方的,有的是来自别的的工程师,有的则是我自己总结的。
jopen
9年前
Spark
分布式/云计算/大数据
0
推荐
12K
浏览
本文主要介绍在一个分布式系统中, 怎么样生成全局唯一的 ID
在分布式系统存在多个 Shard 的场景中, 同时在各个 Shard 插入数据时, 怎么给这些数据生成全局的 unique ID? 在单机系统中 (例如一个 MySQL 实例), uni...
jopen
9年前
分布式
分布式/云计算/大数据
0
推荐
14K
浏览
Hadoop 之 MapReduce 框架演变详解
所谓的经典版本的MapReduce框架,也是Hadoop第一版成熟的商用框架,简单易用是它的特点
jopen
9年前
MapReduce
分布式/云计算/大数据
0
推荐
49K
浏览
基于Spark的机器学习经验
这篇内容基于我去年的一些感悟写的,但是今年才在Stuq 的微信群做的分享。从技术角度而言,对Spark的掌握和使用还是显得很手生的。但是今天一位做数据分析相关的朋友说,受这篇内容影响,他接受了 ...
jopen
9年前
Spark
分布式/云计算/大数据
1
2
3
4
5
6
7
8
9
10
经验分享,提升职场影响力
投稿
热门问答
热门文档