大数据入行新手如何进行机器学习? 经验

Mahout和Hadoop Apache Mahout项目的目的是建立一个可扩展的机器学习库。 大数据分析与hadoop之间存在一定程度的重叠 Mahout内置聚类、分类以及协同过滤等算法。除此之外还有:

jopen 2015-01-08   28550   0

大数据相关资源集合:Awesome Big Data 经验

大数据相关的框架,资源和其实用的内容。Inspired by awesome-php , awesome-python , awesome-ruby , hadoopecosystemtable & big-data

jopen 2014-10-11   79484   0

大数据相关技术、Hadoop生态、LinkedIn内部实战 经验

董老师开讲了《大数据入门》2015.01.17 硅谷创业协会讲座笔记: 同学们好,今天的讲座主题是大数据入门,我的大纲如下 首先自我介绍一下,我叫董飞,目前在硅谷的一家做在线教育公司C

jopen 2015-01-26   192894   0

大数据计算平台Spark内核全面解读 经验

Spark是起源于美国加州大学伯克利分校AMPLab的大数据计算平台,在2010年开源,目前是Apache软件基金会的顶级项目。随着 Spark在大数据计算领域的暂露头角,越来越多的企业开始关注和使用。

jopen 2015-02-03   29051   0

6个用于大数据分析的最好工具 经验

原文 http://www.36dsj.com/archives/22617 大数据是一个含义广泛的术语,是指数据集,如此庞大而复杂的,他们需要专门设计的硬件和软件工具进行处理。该数据集通常是万亿或EB的大小。这些

jopen 2015-02-09   54075   0

python实现的大数据科学计算包:Blaze 经验

Blaze是新一代NumPy,python实现的科学计算包。专门为大数据打造。用于处理分布式的各种不同数据源的计算。 项目主页: http://www.open-open.com/li

jopen 2014-02-07   54602   0

Spark + ansj 对大数据量中文进行分词 经验

目前的分词器大部分都是单机服务器进行分词,或者使用hadoop mapreduce对存储在hdfs中大量的数据文本进行分词。由于mapreduce的速度较慢,相对spark来说代码书写较繁琐。本文使用 spark + ansj对存储在hdfs中的中文文本数据进行分词。

x286 2015-05-25   149807   0

Airbnb开源的三个大数据工具 经验

数据驱动在airbnb开发过程中的实践,作为内部人士,我来给大家分享、总结一下3个airbnb开源大数据神器 Airpal 第一个神器叫 Airpal ,是airbnb内部最炙手可热的数据分析工具

jopen 2015-06-08   59973   0
Airbnb  

大数据与Hadoop之间是什么关系? 经验

html 大数据在近些年来越来越火热,人们在提到大数据遇到了很多相关概念上的问题,比如云计算、 Hadoop等等。那么,大数据是什么、Hadoop是什么,大数据和Hadoop有什么关系呢? 大数据概念

pm45e 2015-08-03   32007   0

我所理解的大数据个性化推荐 经验

如何定义不同外在因子对于推荐结果的影响,也就是如何针对于不同外在因子赋予其应有的权重比。这需要数据的统计! 特别是在当期大数据的背景下,这种基于统计的规则权重模型愈显有效。 大规模的数据统计是能够体现数据趋势的,这点毋庸置疑!

jopen 2015-11-15   26121   0

开源大数据处理工具汇总(下) 经验

作者:大数据女神-诺蓝(微信公号:dashujunvshen)。本文是36大数据专稿,转载必须标明来源36大数据。 接上一部分: 一共81个,开源大数据处理工具汇总(上) ,第二部分主要收集整理的

jopen 2016-01-05   77527   0

大数据平台CDH集群离线搭建 经验

H集群>的步骤。 [TOC] 前言 以Apache Hadoop为主导的大数据技术的出现,使得中小型公司对于大数据的存储与处理也拥有了武器。目前Hadoop有不少发行版:华为发行版 收费 、Intel发行版

jopen 2016-01-19   25575   0

构建大数据生态需要哪些核心技术? 经验

22号“大数据生态构建”厂商共建专场的重点演讲内容,为没能到现场聆听的小伙伴们奉上饱满的干货内容。 ( 进入 QCon北京2016 大会官网,免费下载三天的讲师演讲PPT。 ) 参与大数据技术实践

ozhc1633 2016-04-23   39175   0

大数据和区块链之间的比较分析 经验

大数据和区块链两者之间有个共同的关键词:分布式,代表了一种从技术权威垄断到去中心化的转变。 分布式存储:HDFS vs. 区块 大数据,需要应对海量化和快增长的存储,这要求底层硬件架构和文

avalon6884 2017-03-08   40607   0

图数据库——大数据时代的高铁 经验

如果把传统关系型数据库比做火车的话,那么到现在大数据时代,图数据库可比做高铁。它已成为NoSQL中关注度最高,发展趋势最明显的数据库。 简介 在众多不同的数据模型里,关系数据模型自20世纪80

大数据也有西大荒——这个行业有点乱 资讯

ugly 大数据已经发展到了一个关键阶段。到 2017 年,整个大数据市场将增长到 500 亿美金,但很不幸 55% 的大数据项目都是失败的。与机遇同在的是炒作和不实的信息,我们正处在大数据的西大荒阶

jopen 2013-09-16   8844   0

大数据量下,58同城mysql实践 经验

2)常见问题及解决思路 3)拆库实战 4)拆库后业务实战 5)总结 一、基本概念 大数据量下,搞mysql,以下概念需要先达成一致 1)单库,不多说了,就是一个库 2)分片

likeo 2015-04-21   15086   0

英国设立图灵研究院研究大数 资讯

英国设立了一家以计算机科学奠基人名字命名的研究院,主要研究大数据。BBC 报导 ( 中文 ),财政大臣奥斯本在本周推出新预算案的同时也宣布成立一家新的研究所,大规模收集分析有利市场发展的数据。该机构以图灵(Alan

jopen 2014-03-20   13084   0

NSA 将开源大数据分析工具 Nifi 资讯

NSA和开源软件并非水火不容。NSA本周宣布与Apache软件基金会合作,在Apache许可证下开源大 数据分析工具Niagarafiles (Nifi)。NSA称 Nifi 能在多个计算机网络中自动化数据流,即使数据格式和协议存在差异。目前关于Nifi的细节透露的不多。

jopen 2014-11-27   6443   0
Nifi  

大数据安全分析(分析篇) 资讯

事件响应)这三个阶段就是属于安全分析的范畴,也是我们下面要讨论的内容,附带地也将提出个人看法,关于大数据分析平台支撑安全分析活动所需关键要素。 狩猎(hunting) 近两年狩猎的概念在国际上比较

jopen 2015-07-13   12610   0
1 2 3 4 5 6 7 8 9 10