0推荐
21K 浏览

内容抽取工具集合 Apache Tika

Tika是一个内容抽取的工具集合(a toolkit for text extracting)。它集成了POI, Pdfbox 并且为文本抽取工作提供了一个统一的界面。
openkk 13年前   
0推荐
27K 浏览

PHP 搜索引擎 RiSearch PHP

RiSearch PHP是一个高效,功能强大的搜索引擎,特别适用于中小型网站。RiSearch PHP非常快。
openkk 13年前   
0推荐
51K 浏览

Java搜索引擎 Lucene

Lucene是一套用于全文检索和搜寻的开源程式库,由Apache软件基金会支持和提供。Lucene提供了一个简单确强大的应用程式接口,能够做全文索引和搜寻,在Java开发环境里Lucene是一个...
openkk 13年前   
0推荐
19K 浏览

具有强大功能的全文搜索引擎:Hyper Estraier

Hyper Estraier是一个具有强大功能的全文搜索引擎,它由一个日本人开发,支持中文,日文,韩文,英文,以及其它多国语言。Hyper Estraier采用LGPL开源授权协议。
openkk 13年前   
0推荐
45K 浏览

Python全文搜索引擎 Hypy

Hypy 是一个为 Python 应用程序编写的全文搜索引擎,可以使用它从Python代码索引和搜索你的文档。
openkk 13年前   
0推荐
24K 浏览

Java搜索引擎 IndexTank

IndexTank, 一套基于Java的索引-搜索引擎实现,支持的特性包括:variables (boosts), categories (facets), faceted search, sn...
jopen 13年前   
0推荐
25K 浏览

利用 Sphinx 实现实时全文检索

Sphinx 0.9.9及以前的版本,原生不支持实时索引,一般的做法是通过主索引+增量索引的方式来实现“准实时”索引,最新的1.10.1(trunk中,尚未发 布)终于支持real-time i...
jopen 13年前   
0推荐
19K 浏览

全文搜索引擎 groonga

Groonga 是一个全文搜索引擎和一个基于列的存储数据库。
openkk 13年前   
0推荐
29K 浏览

Python模板引擎 Jinja

Jinja是基于python的模板引擎,功能比较类似于于PHP的smarty,J2ee的Freemarker和velocity。
openkk 13年前   
0推荐
54K 浏览

Lucene原理

Lucene是一个高性能的java全文检索工具包,它使用的是倒排文件索引结构。
openkk 13年前   
0推荐
24K 浏览

Nutch简介

Nutch 是一个开源Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。 尽管Web搜索是漫游Internet的基本要求, 但是现有web搜...
openkk 13年前   
1 2 3 4 5 6 7 8 9 10

经验分享,提升职场影响力

投稿

热门问答

    热门文档