0推荐
42K 浏览

基于Java的开源数据挖掘解决方案:RapidMiner

Java语言开发,RapidMiner(前身是Yale)已经是一个比较成熟的数据挖掘解决方案了,包括常见的机器学习、NLP、推荐、预测等方法(推荐只占其中很小一部分),而且带有GUI的数据分析环...
jopen 11年前   
0推荐
24K 浏览

Hive代码组织及架构简单介绍

Serialzers/Deserialzers(trunk/serde) 此组件允许用户自己开发自定义序列化、反序列化文件解析器,hive自身也内置了一些序列化解析类。 MetaSto...
jopen 11年前   
0推荐
22K 浏览

数据挖掘平台:ELKI

ELKI(Environment for Developing KDD-Applications Supported by Index-Structures)主要用来聚类和找离群点。ELKI是类...
jopen 11年前   
0推荐
26K 浏览

Pig可视化开源框架:Lipstick

Apache Pig是一个基于Hadoop的大规模数据分析平台,为复杂的海量数据并行计算提供了一个简单的操作和编程接口。为了简化Pig使用,Netflix开发并开源了Pig任务可视化框架Lips...
jopen 11年前   
0推荐
82K 浏览

Java开源数据挖掘平台:SPMF

SPMF是一个采用Java开发的开源数据挖掘平台。
jopen 12年前   
0推荐
97K 浏览

推荐五个免费开源数据挖掘软件(Orange、RapidMiner等)

 Orange 是一个基于组件的数据挖掘和机器学习软件套装,它的功能即友好,又很强大,快速而又多功能的可视化编程前端,以便浏览数据分析和可视化,基绑定了 Python以进行脚本开发。它包含了完整...
jopen 12年前   
0推荐
27K 浏览

ETL工具 JMyETL

一种多个DBMS间导入导出表及其数据的ETL工具。
jopen 12年前   
0推荐
140K 浏览

开源ETL工具 Pentaho Data Integration (Kettle)

Kettle是一款国外开源的etl工具,纯java编写,绿色无需安装,数据抽取高效稳定(数据迁移工具)。Kettle中有两种脚本文件,transformation和job,transformat...
openkk 12年前   
0推荐
35K 浏览

数据挖掘工具 RapidMiner

RapidMiner是世界领先的数据挖掘解决方案,在一个非常大的程度上有着先进技术。它数据挖掘任务涉及范围广泛,包括各种数据艺术,能简化数据挖掘过程的设计和评价。
openkk 12年前   
0推荐
32K 浏览

数据仓库Hive管理软件 phpHiveAdmin

这是一个由php编写的hadoop hive查询工具,可以方便的查询hive中的数据和相关信息。
fmms 13年前   
0推荐
97K 浏览

PyMining - 基于Python的数据挖掘平台

这是一个能够根据源数据(比如说用csv格式表示的矩阵,或者中文文档)使用多种多样的算法去得到结果的一个平台。 算法能够通过xml配置文件去一个一个的运行,比如在开始的时候,我们可以先运行一...
fmms 13年前   
0推荐
50K 浏览

BI OLAP-ISH 解决方案 HBase-Lattice

HBase-Lattice是一个尝试提供基于HBase的BI OLAP-ISH的解决方案,主要目标是查询时的实时SLAs,查询事实信息的低延迟(通过并行MapReduce的增量编译器来实现),强...
openkk 13年前   
0推荐
132K 浏览

ETL工具 Talend Open Studio

Talend Open Studio 是一个 ETL (Extract, Transform, and Load) 工具,可执行数据仓库到数据库之间的数据同步,提供基于 Eclipse RCP ...
openkk 13年前   
1 2 3 4 5 6 7 8 9

经验分享,提升职场影响力

投稿

热门问答

    热门文档