登录
注册
首页
项目
经验
代码
文库
问答
博客
资讯
数据挖掘
(共
173
篇经验)
0
推荐
42K
浏览
基于Java的开源数据挖掘解决方案:RapidMiner
Java语言开发,RapidMiner(前身是Yale)已经是一个比较成熟的数据挖掘解决方案了,包括常见的机器学习、NLP、推荐、预测等方法(推荐只占其中很小一部分),而且带有GUI的数据分析环...
jopen
11年前
数据挖掘
RapidMiner
0
推荐
24K
浏览
Hive代码组织及架构简单介绍
Serialzers/Deserialzers(trunk/serde) 此组件允许用户自己开发自定义序列化、反序列化文件解析器,hive自身也内置了一些序列化解析类。 MetaSto...
jopen
11年前
Hive
数据挖掘
0
推荐
22K
浏览
数据挖掘平台:ELKI
ELKI(Environment for Developing KDD-Applications Supported by Index-Structures)主要用来聚类和找离群点。ELKI是类...
jopen
11年前
数据挖掘
ELKI
0
推荐
26K
浏览
Pig可视化开源框架:Lipstick
Apache Pig是一个基于Hadoop的大规模数据分析平台,为复杂的海量数据并行计算提供了一个简单的操作和编程接口。为了简化Pig使用,Netflix开发并开源了Pig任务可视化框架Lips...
jopen
11年前
数据挖掘
Lipstick
0
推荐
82K
浏览
Java开源数据挖掘平台:SPMF
SPMF是一个采用Java开发的开源数据挖掘平台。
jopen
12年前
数据挖掘
SPMF
0
推荐
97K
浏览
推荐五个免费开源数据挖掘软件(Orange、RapidMiner等)
Orange 是一个基于组件的数据挖掘和机器学习软件套装,它的功能即友好,又很强大,快速而又多功能的可视化编程前端,以便浏览数据分析和可视化,基绑定了 Python以进行脚本开发。它包含了完整...
jopen
12年前
数据挖掘
0
推荐
27K
浏览
ETL工具 JMyETL
一种多个DBMS间导入导出表及其数据的ETL工具。
jopen
12年前
ETL
数据挖掘
0
推荐
140K
浏览
开源ETL工具 Pentaho Data Integration (Kettle)
Kettle是一款国外开源的etl工具,纯java编写,绿色无需安装,数据抽取高效稳定(数据迁移工具)。Kettle中有两种脚本文件,transformation和job,transformat...
openkk
12年前
ETL
数据挖掘
0
推荐
35K
浏览
数据挖掘工具 RapidMiner
RapidMiner是世界领先的数据挖掘解决方案,在一个非常大的程度上有着先进技术。它数据挖掘任务涉及范围广泛,包括各种数据艺术,能简化数据挖掘过程的设计和评价。
openkk
12年前
数据挖掘
0
推荐
32K
浏览
数据仓库Hive管理软件 phpHiveAdmin
这是一个由php编写的hadoop hive查询工具,可以方便的查询hive中的数据和相关信息。
fmms
13年前
Hive
数据挖掘
0
推荐
97K
浏览
PyMining - 基于Python的数据挖掘平台
这是一个能够根据源数据(比如说用csv格式表示的矩阵,或者中文文档)使用多种多样的算法去得到结果的一个平台。 算法能够通过xml配置文件去一个一个的运行,比如在开始的时候,我们可以先运行一...
fmms
13年前
Python
数据挖掘
0
推荐
50K
浏览
BI OLAP-ISH 解决方案 HBase-Lattice
HBase-Lattice是一个尝试提供基于HBase的BI OLAP-ISH的解决方案,主要目标是查询时的实时SLAs,查询事实信息的低延迟(通过并行MapReduce的增量编译器来实现),强...
openkk
13年前
HBase
数据挖掘
0
推荐
132K
浏览
ETL工具 Talend Open Studio
Talend Open Studio 是一个 ETL (Extract, Transform, and Load) 工具,可执行数据仓库到数据库之间的数据同步,提供基于 Eclipse RCP ...
openkk
13年前
Java
Perl
数据挖掘
1
2
3
4
5
6
7
8
9
经验分享,提升职场影响力
投稿
热门问答
热门文档