2015 Bossie评选:最佳开源大数据工具 资讯

源工具获奖者,下面我们来简单介绍下这些获奖的技术工具。 1. Spark 在Apache的大数据项目中,Spark是最火的一个,特别是像IBM这样的重量级贡献者的深入参与,使得Spark的发展和进步速度飞快。

jopen 2015-10-21   51330   0

大数据全栈式开发语言 – Python 资讯

应用开发人员,只需要学会一门语言,就可以实现整个应用。 受此启发,我发现 Python 可以称为大数据全栈式开发语言。因为 Python 在云基础设施,DevOps,大数据处理等领域都是炙手可热的语言。 领域 流行语言 云基础设施 Python

pm45e 2015-08-03   38813   1
Python  

大数据分析查询引擎Impala 资讯

Impala是Cloudera公司主导开发的新型查询系统,它提供SQL语义,能查询存储在Hadoop的HDFS和HBase中的PB级大数 。已有的Hive系统虽然也提供了SQL语义,但由于Hive底层执行使用的是MapReduce引擎

jopen 2015-11-09   51967   1
Impala  

大数据与机器学习周报 第5期 资讯

正式停止服务。我们将在 4月11日 后开始删除用户储存在上面的数据。” 《麻省理工学院推出“数据美国”大数据可视化工具》 :数据美国”项目得益于美国总统奥巴马2013年签署的一项政务数据公开(Open D

jopen 2016-04-12   29688   0

MapR CEO对2016大数据的5个预测 资讯

沿,他们提供了最佳的大数据平台,同时其核心架构成功地满足了现代数据的挑战”。今日之时代是大数据时代;近日,MapR CEO John Schroeder给出了自己对于2016年大数据的 5个预测 。

jopen 2016-02-15   9954   0
大数据   MapR  

决胜大数据的六大要素 资讯

每次在为一家企业搭建大数据平台的起步阶段,他们总是向我展示各种他们采用的各种前沿技术,还有他们视若珍宝的数据储备。但是毫不避讳地讲,我根本不想在这个阶段讨论这些方面的细节。因为炫酷的技术或海量的数据储备并不是大数据项目成功最关键因素。

jopen 2016-03-04   10047   0

大数据在房地产行业的研究和运用 资讯

大数据时代,数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。在SDK累计接入量突破65亿后,个推将大数据应用到房地产领域。依托于个推大数据平台的个房首个数据产品“拿地宝”正式上线,冷

jopen 2016-01-07   13259   0

最夯的大数据分析工具-Apache Spark 经验

Abstraction forIn-Memory Cluster Computing论文。 在分析大数据的时候,LIBSVM无法顺利建立模型,而Spark的RDD解决了此问题,并且提供了MLlib,可在分散式的系统下快速建模。

jopen 2015-02-11   20695   0

大众点评的大数据传输工具:wormhole 经验

Wormhole 是大众点评的大数据传输工具,目前支持类似 hdfs, hive, hbase, mysql, greenplum, sqlserver, mongodb, sftp, salesforce

jopen 2014-11-22   22512   0

大数据处理算法一:Bitmap算法 经验

给新数组定长的话效率还能提高一倍。 import java.util.BitSet; /** * 大数据处理算法一,bitmap算法 * @author JYC506 * */ public class

jopen 2015-05-08   89687   0
算法  

后Hadoop时代的大数据架构 经验

提 到大数据分析平台,不得不说Hadoop系统,Hadoop到现在也超过10年的历史了,很多东西发生了变化,版本也从0.x进化到目前的2.6版本。我 把2012年后定义成后Hadoop平台时代,这不是说不用Hadoop,而是像NoSQL

b77m 2015-04-22   140189   0

浅谈开源大数据平台的演变 经验

一说到开源大数据处理平台,就不得不说此领域的 开 山鼻祖Hadoop,它是GFS和MapReduce的开源实现。 虽然在此之前有很多类似的分布式存储和计算平台,但真正能实现工业级应用、降低使用门槛、带

b77m 2015-04-22   37643   0

大数据处理框架Apache Spark入门 经验

是一个围绕速度、易用性和复杂分析构建的大数据处理框架。最初在2009年由加州大学伯克利分校的AMPLab开发,并于2010年成为Apache的开源项目之一。 与Hadoop和Storm等其他大数据和MapReduce技术相比,Spark有如下优势。

jopen 2015-11-16   61047   0

快速基于echarts的大数据可视化 经验

快速基于echarts的大数据可视化,echarts纯粹的js实现的图表工具,快速开发的步骤如下: 1、引入echarts的依赖js库