Apache Jackrabbit 是由 Apache Foundation 提供的 JSR-170 的开放源码实现,JSR-170把自己定义为一个能与内容仓库互相访问的,独立的,标准的方式。同时它也
Apache Jackrabbit 是由 Apache Foundation 提供的 JSR-170 的开放源码实现,JSR-170把自己定义为一个能与内容仓库互相访问的,独立的,标准的方式。同时它也
Apache Jackrabbit 是由 Apache Foundation 提供的 JSR-170 的开放源码实现,JSR-170把自己定义为一个能与内容仓库互相访问的,独立的,标准的方式。同时它也
Apache Jackrabbit 是由 Apache Foundation 提供的 JSR-170 的开放源码实现,JSR-170把自己定义为一个能与内容仓库互相访问的,独立的,标准的方式。同时它也
Apache Jackrabbit 是由 Apache Foundation 提供的 JSR-170 的开放源码实现,JSR-170把自己定义为一个能与内容仓库互相访问的,独立的,标准的方式。同时它也
对第三方文件格式的支持。 Apache Tika 1.1 发布了,该版本包含很多改进和 bug 修复,详情请看 http://www.apache.org/dist/tika/CHANGES-1
Apache PDFBox 2.0.0 RC3 发布,此版本现已提供下载: http://pdfbox.apache.org/download.cgi RC2 版本收到大量的反馈,此版
使用Apache Solr对数据库建立索引 http://blog.sina.com.cn/s/blog_56fd58ab0100u5wk.html 主要分为两部分,第一部分是对《db-data-config
Tajo 是一个基于 Hadoop 实现的分布式数据仓库系统,特点是低延迟、高可伸缩,提供专用查询和针对存储在HDFS上的大数据集和其他数据源的ETL 工具。 特点: 可伸缩性和低延迟 完全分布式的
Apache 软件基金会宣布 Apache Impala 孵化成功,升级为顶级项目。 Impala 是一个高性能分析数据库,可针对存储在 Apache Hadoop 集群中的 PB 级数据进行闪电般快速的分布式
Apache Ignite是一个通用的数据库缓存系统,它不仅支持所有的底层数据库系统,比如RDBMS、NoSQ和HDFS,还支持Write-Through和Read-Through、Write-Behind
Apache Lucy 是一个全文搜索引擎库,使用 C 语言编写,主要面向一些动态语言,目前提供 Perl 语言的绑定。目前该项目还只是 Apache 基金会的孵化项目。 Apache Lucy
Apache Derby 是 Apache软件基金会 所研发的开放源码 数据库管理系统 ;由于Derby是一个纯Java程式,因此只需要 操作系统 支援 Java虚拟机 ,Derby便可执行。 D
作用是在结构化数据存储与Hadoop之间进行数据交换,通过 Sqoop ,你可以批量将你关系型数据库中的数据导入到Hadoop中,也可以将Hadoop中的数据导出到其它结构化存储中。 Sqoop项
Apache Hive 0.9.0 发布,该版本包含大量新特性、改进和 bug 修复,详情请看 改进记录 。 Hive是一个基于Hadoop的数据仓库平台。通过hive,我们可以方便地进行ETL的
Sqoop是一个用来将Hadoop和关系型数据库中的数据相互转移的工具,可以将一个关系型数据库(例如 : MySQL ,Oracle ,Postgres等)中的数据导入到Hadoop的HDFS中,也可
PDFBox是Java实现的PDF文档协作类库,提供PDF文档的创建、处理以及文档内容提取功能,也包含了一些命令行实用工具。 主要特性包括: 从PDF提取文本 合并PDF文档 PDF 文档加密与解密
Hive是一个基于Hadoop的数据仓库平台。通过hive,我们可以方便地进行ETL的工作。hive定义了一个类似于SQL的查询语言:HQL,能 够将用户编写的QL转化为相应的Mapreduce程序基于Hadoop执行。
Hive是一个基于Hadoop的数据仓库平台。通过hive,我们可以方便地进行ETL的工作。hive定义了一个类似于SQL的查询语言:HQL,能 够将用户编写的QL转化为相应的Mapreduce程序基于Hadoop执行。
Apache Jackrabbit 是由 Apache Foundation 提供的 JSR-170 的开放源码实现,JSR-170把自己定义为一个能与内容仓库互相访问的,独立的,标准的方式。同时它也