P52

weka完整中文教程 文档

WEKA的全名是怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),同时weka也是新西兰的一种鸟名,而WEKA的主要开发者来自新西兰。 WEKA作为一个公开的数据挖掘工作平台,集合了大量能承担数据挖掘任务的机器学习算法,包括对数据进行预处理,分类,回归、聚类、关联规则以及在新的交互式界面上的可视化。 如果想自己实现数据挖掘算法的话,可以参考weka的接口文档。在weka中集成自己的算法甚至借鉴它的方法自己实现可视化工具并不是件很困难的事情。

mn3n 2015-12-13   2046   0
P29

  数据挖掘算法以及其实现 文档

基于线性回归模型拟合一个班学生的学习成绩,建立预测模型。数据可由自己建立100个学生的学习成绩。

maoying 2017-04-26   847   0
P9

  数据挖掘最常见的十种方法 文档

下面介绍十种数据挖掘(Data Mining)的分析方法,以便于大家对模型的初步了解,这些都是日常挖掘中经常遇到的算法,希望对大家有用!(甚至有数据挖掘公司,用其中的一种算法就能独步天下)

maoying 2017-04-26   1114   0
P20

  kettle 基础整理 文档

Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,数据抽取高效稳定。

junb_chen 2017-04-23   1508   0
数据挖掘   培训   HTTP   SQL   XML  
P31

  pentaho61教学文件 文档

chiangandy 2017-04-01   981   0
数据挖掘   教学   手册   HTTP   Go  
P6

  etl构建数据仓库五步法 文档

在数据仓库构建中,ETL贯穿于项目始终,它是整个数据仓库的生命线,包括了从数据清洗,整合,到转换,加载等的各个过程,如果说数据仓库是一座大厦,那么ETL就是大厦的根基,ETL抽取整合数据的好坏直接影响到最终的结果展现。所以ETL在整个数据仓库项目中起着十分关键的作用,必须摆到十分重要的位置。

opengzmaq 2017-03-03   946   0
P16

  hive1.2.1安装部署说明书 文档

shenxxPH 2016-12-26   680   0
数据挖掘   x86   SQL  
P9

  kettle规范文档 文档

ETL的开发目前使用IBM的Datastage Designer工具,在开发人员的客户机上这客户端工具进行开发,不允许使用远程登录到服务器的方法进行开发,ETL的开发原则涉及很多方面,本文档根据DataStage的对象的分类,从大到小分Project、Job、Stage等几块来描述:

snowyon 2016-11-21   1073   0
P3

  elt 之 kettle 开发规范 文档

本ETL流程规范试图建立一个通用的ETL流程开发规范,针对不同项目组的实际情况,可自行进行逐步的完善和修改。

snowyon 2016-11-21   1059   0
P2

  数组 文档

【数组】数组是同一数据类型的一组值数组属于引用类型,因此存储在堆内存中数组元素初始化或给数组元素赋值都可以在声明数组时或在程序的后面阶段中进行定义-数组定义时[]必须接在类型后面,不能接在数组名后面。

1994_ 2016-10-07   2938   0
P43

  teradata数据仓库简介 文档

Teradata数据库简介Teradata数据仓库事业部华南区Agenda关于TERADATATeradata数据库原理Teradata数据库架构Teradata数据库工作原理Teradata特性Teradata数据仓库构建基本概念常用工具介绍管理的一些约定关于TERADATATeradata最初产生于1976年,由加州理工学院和花旗银行的高科技项目-创建一个能够分析10的12次方bytes数据的系统。

zimeng2008 2016-05-27   1157   0
P81

  数据挖掘讲座 文档

数据仓库概念 数据仓库体系结构及组件 数据仓库设计 数据仓库技术(与数据库技术的区别) 数据仓库性能 数据仓库应用 数据挖掘应用概述 数据挖掘技术与趋势 数据挖掘应用平台(科委申请项目)

landman 2016-04-08   3242   0
P27

  Topic-Sentiment Mixture:Modeling Facets and Opinions in Weblogs 文档

Customers: need peer opinions to make purchase decisions Business providers: need customers’ opinions to improve product need to track opinions to make marketing decisions Social researchers: want to know people’s reactions about social events Government: wants to know people’s reactions to a new policy Psychology, education, etc.

cwdk 2016-02-20   1746   0
数据挖掘   Go   diff  
P40

  数据分析经验分享 文档

Content数据分析前,我们需要思考>《孙子兵法·谋攻篇》:故上兵伐谋,其次伐交,其次伐兵,其下攻城;攻城之法为不得已。像一场战役的总指挥影响着整个战役的胜败一样,数据分析师的思想对于整体分析思路,甚至分析结果都有着关键性的作用。>问题分析结果呈现分析思路与方法数据选取数据分析前,我们怎么去思考?每一个步骤可能面临的问题以及需要准备的东西??? 分析问题和解决问题的思路>两个重点步骤精确的陈述问题Where----哪里存在问题?What------存在的问题是什么?Why-------原因在哪里?When-----什么时候开始出现这样的问题?Who------与什么对象有关?Howmany-----发生的次数和数量?Howmuch------损失有多大?

kfeole 2016-01-15   664   0
P7

  数据挖掘中聚类分析的技术方法 文档

摘要:数据挖掘是信息产业界近年来非常热门的研究方向,聚类分析是数据挖掘中的核心技术。本文对数据挖掘领域的聚类分析方法及代表算法进行分析,并从多个方面对这些算法性能进行比较,同时还对聚类分析在数据挖掘中的几个应用进行了阐述。关键词:数据挖掘;聚类分析;聚类算法

likfefe 2016-01-14   2335   0
P40

  数据分析经验分享 文档

数据分析经验分享Content数据分析前,我们需要思考>《孙子兵法·谋攻篇》:故上兵伐谋,其次伐交,其次伐兵,其下攻城;攻城之法为不得已。像一场战役的总指挥影响着整个战役的胜败一样,数据分析师的思想对于整体分析思路,甚至分析结果都有着关键性的作用。>问题分析结果呈现分析思路与方法数据选取数据分析前,我们怎么去思考?每一个步骤可能面临的问题以及需要准备的东西??? 分析问题和解决问题的思路>两个重点步骤精确的陈述问题Where----哪里存在问题?What------存在的问题是什么?Why-------原因在哪里?When-----什么时候开始出现这样的问题?Who------与什么对象有关?Howmany-----发生的次数和数量?

bwnx 2015-12-14   1966   0
P118

  数据挖掘8章聚类 文档

第八章聚类分析8.1什么是聚类分析?8.2聚类分析中的数据类型8.3主要聚类分析方法分类8.4划分方法(PartitioningMethods)8.5分层方法8.6基于密度的方法8.7基于网格的方法8.8基于模型(Model-Based)的聚类方法8.9孤立点分析

kcde 2015-12-12   1799   0
P13

  数据挖掘9章10章 文档

第九章数据挖掘的应用和发展趋势9.1复杂数据对象的多维分析和描述性挖掘9.2空间数据挖掘9.3多媒体数据挖掘9.4时序数据和序列数据的挖掘9.5文本数据库挖掘9.6Web挖掘Data Mining:Conceptsand Techniques9.1复杂数据对象的多维分析和描述性挖掘结构化数据的概化空间和多媒体数据概化中的聚集和近似计算对象标识符和类/子类层次的概化类复合层次的概化对象立方体的构造与挖掘用分而治之方法对规划数据库进行基于概化的挖掘

kcde 2015-12-12   2407   0
P26

  数据挖掘8章聚类2 文档

Chapter8.聚类分析什么是聚类分析?聚类分析中的数据类型主要聚类分析方法分类划分方法(PartitioningMethods)分层方法基于密度的方法基于表格的方法基于模型(Model-Based)的聚类方法异常分析总结划分方法:基本概念划分方法:将一个包含n个数据对象的数据库组织成k个划分(k<=n),其中每个划分代表一个簇(Cluster)。给定一个k,要构造出k个簇,并满足采用的划分准则:全局最优:尽可能的列举所有的划分;启发式方法:k-平均和k-中心点算法k-平均(MacQueen’67):由簇的中心来代表簇;

kcde 2015-12-12   1893   0
1 2 3 4 5 6 7 8 9 10

关键词

最新上传

热门文档