基于MapReduce开发的数据挖掘/机器学习库 - Mahout 经验

传统数据挖掘/机器学习库存在的问题 缺少一个活跃的技术社区 扩展性差 文档化差,缺少实例 不开源,商业化库 通常由研究机构开发 实施性差 Apache Mahout优点 技术社区活跃

jopen 2016-01-20   17099   0

数据挖掘领域十大经典算法 经验

International Conference on Data Mining (ICDM) 早前评选出了数据挖掘领域的十大经典算法:C4.5, k-Means, SVM, Apriori, EM, PageRank

weixinde 2016-01-29   26117   0

数据挖掘-聚类-K-means算法Java实现 经验

例如下图的样本集,初始选择是三个质心比较集中,但是迭代3次之后,质心趋于稳定,并将样本集分为3部分 我们对每一个步骤都进行分析 step1:选择K个点作为初始质心 这一步首先要知道K的值,也就是说K是手动设置的,而不是像EM算法那样自动聚类成n个簇

jopen 2013-06-30   118642   0
算法  

观点收集:关于机器学习和数据挖掘找工作 经验

感谢邀请,说说我自己的一些观点,求拍。我觉得从事数据挖掘工作,尤其是在互联网行业,主要需要三个方面的能力,即机器学习和数据挖掘的理论知识、编程开发与数据结构算法的基础和业务理解与沟通表达的能力。

jopen 2015-02-10   30568   0
P22

  《基于python语言的网络数据挖掘》实验指导书 文档

《基于Python语言的网络数据挖掘》实验指导书 电子科技大学信息与软件工程学院 二○一四年6月 一、 实验教学目的和要求: 实验目的: 本课程实验旨在加深学生对于网络大数据挖掘的理解,培养学生分析、设计、实现基于

hyfair 2016-07-04   932   0
P16

  详细解释数据挖掘中的 10 大算法 文档

详细解释数据挖掘中的 10 大算法(上) 2015/09/04 · IT技术 · 数据挖掘, 算法 本文由 伯乐在线 - 土豆粉ss 翻译,黄利民 校稿。未经许可,禁止转载! 英文出处:rayli。欢迎加入翻译组。

carcar 2015-10-26   456   0

7种常用的互联网数据挖掘技术 资讯

数据挖掘的技术有很多种,按照不同的分类有不同的分类法。 下面着重讨论一下互联网数据挖掘中常用的一些技术:统计技术,关联规则,连接分析,决策树,神经网络,差别分析,概念描述七种常用的互联网数据挖掘的技术。

n6xb 2015-04-07   23326   0

领英宣布开源数据挖掘软件WhereHows 资讯

WhereHows,一个企业级的数据挖掘软件。 准确的说,领英称它为“数据发现软件”。从商业角度讲,WhereHows 的目标是从分布式的多种元数据中进行挖掘。 据领英发布的资料显示,WhereHows 已经挖掘了 50,000

jopen 2016-03-07   6308   0

Salesforce收购PredictionIO,加强自身机器学习和数据挖掘能力 资讯

Salesforce 正式对外宣布收购 PredictionIO,用于增强自己在机器学习和大数据分析方面的能力。 Prediction IO 于 500 Satrtups 毕业,在 2014年 拿到了

jopen 2016-02-20   11475   0

什么是:人工智能\机器学习\自然语言\数据挖掘 资讯

chaoxu.sinaapp.com/archives/3433 什么是:人工智能\机器学习\自然语言\数据挖掘 人工智能(AI)是一个大方向,机器学习可以看作是数学算法,这些算法可以作为实现人工智能的一个有效途径、方法,即作为AI的一个

jopen 2015-11-30   25564   0
P55

  数据挖掘5章概念描述:特征化与比较 文档

概念描述2018/10/151 2. 特征化和比较什么是概念描述? 数据概化和基于汇总的特征化 解析特征化: 分析属性之间的关联性 挖掘类比较:获取不同类之间的不同处 在大型数据库中挖掘描述统计度量 讨论 总结2018/10/152

kcde 2015-12-12   543   0
P42

  罗旭祥 基于数据挖掘的产品设计 文档

1. 产品与数据 —— 基于数据挖掘的产品设计罗旭祥 188 0218 5564 Saxon.luo@gmail.com 2. (本页无文本内容) 3. 引言同样是搜索土豆,他们想看到的一样么? 4

yaljj 2012-09-19   4508   0

开源力量公开课第47期:数据挖掘入门指引(免费) 问答

你好,感谢你的关注,开源力量公开课又开始讲课了,让我们一起向大牛学习吧。 下周二晚8:00-10:00,开源力量公开课第47期:数据挖掘入门指引(免费) 报名地址: http://www.osforce.cn/openclass/64/show

liuhua0311 2014-03-12   12871   0

社交江湖再起波澜:留给今日头条的是社交还是社区? 资讯

会置之不理。恰是如此,社交江湖注定不会平静。 01 首先要给今日头条的公关团队点个赞,媒体放风、CEO 发问、对标友商、官方曝光……娴熟的公关动作下,尽管今日头条的社交产品还没掀开面纱,在媒体

jopen 2019-01-13   5624   0

QQ手机浏览器“虫洞漏洞”挖掘分析全过程 经验

前段时间盘古的同学发现了QQ手机浏览器的“虫洞漏洞”,在这个漏洞的挖掘分析过程中,盘古的同学和我们针对这个漏洞做过内部技术交流,我们也同步分析出了该漏洞,最终由于是盘古的同学第一个发现,所以由盘古的同学报

DorotheaSks 2016-10-21   11797   0
P19

  javaweb之十四(元数据分析) 文档

深入dbutils的实例原理-元数据分析 讲师:王健,QQ:549051701 1、今天的主要内容: 2、今天的主要内容如下 2.1、表之间的关联中的级联关系 1:不设置 - 默认。 当删除主表中的数据时,如果子表中已

wangjianme 2013-03-03   1425   0
P

数据结构与算法分析学习笔记 文档

数据结构与算法分析是计算机专业的必修课——但遗憾的是,我在大学阶段并不是计算机专业的学生,以至于没有系统地跟着老师学习过这门课程。现在我已经工作了,在实际的工作中,我经常感到自己的基础知识不够,有很多问题无法解决。在经历了一段痛苦的斗争后,我选择了自学的道路,想把这门课程扎扎实实地学好。教科书中已经给出了大部分的代码,因此,我基本上也只是重复敲入了一次而已(或者是改写成C++),但这并不是没有意义的。我们在看书的时候经常会觉得自己已经懂了,但如果真的要亲自动手去做了,却会感到无法下手。我认为,亲自输入一次代码并调试通过,比任何空谈都有效。

hb0308513 2011-01-09   461   0

DataCleaner 3.5.1 发布,数据质量分析 资讯

是一个数据质量分析工具,可让您进行数据分析,验证和模拟类似ETL的任务。这些活动可以帮助您管理和监控数据质量,以确保您的数据是有用的,适用于您的业务情况。它可用于主数据管理(MDM)的方法,数据仓库项目,统计研究,为提取

jopen 2013-06-13   6337   0

数据分析到底需要多少种工具? 资讯

种不同的分类学习方法(分类学习算法)在 121 个数据集上的性能,发现 Random Forest (随机森林)和 SVM (支持向量机)分类准确率最高,在大多数情况下超过其他方法。本文针对“大数据分析到底需要多少种工具?”这

码头工人 2015-01-02   17990   0
P43

  数据结构经典问题和算法分析 文档

数据结构经典问题和算法分析(一)-迭代法 来源:   作者:   2007-5-30 21:17:53   字体:[大 中 小] 一、迭代法    迭代法是用于求方程或方程组近似根的一种常用的算法设

threeg 2014-11-20   433   0
1 2 3 4 5 6 7 8 9 10