【全文检索】利用Lucene搜索Java源代码 某些网站允许软件开发社团通过发布开发者指南、白皮书、FAQs【常见问题解答】和源代码以实现信息的共享。随着信息量的增长,和几个开发者贡献出自己的知识库
全文检索 我们生活中的数据总体分为两种:结构化数据和非结构化数据。 · 结构化数据:指具有固定格式或有限长度的数据,如数据库,元数据等。 · 非结构化数据:指不定长或无固定格式的数据,如邮件,word文档等。
1. 全文检索及Lucence 2. 全文检索是计算机程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置。当用户查询时根据建立的索引查找,类似于通过字典的检索字
Apache Lucy 是一个全文搜索引擎库,使用 C 语言编写,主要面向一些动态语言,目前提供 Perl 语言的绑定。相当于是 C 语言版的 Lucene 。 Apache Lucy 0.4.3
xapian 和 scws 开发的全文搜索引擎解决方案,提供 PHP 语言的开发接口。支持海量数据高速检索,功能强大,简单易用,是 PHP 开发的 WEB 应用的全文检索首选解决方案之一! 本项目
摘 要 网络中的资源非常丰富,但是如何有效的搜索信息却是一件困难的事情。建立搜索引擎就是解决这个问题的最好方法。本文首先详细介绍了基于英特网的搜索引擎的系统结构,然后从网络机器人、索引引擎、Web
高性能的对象/搜索引擎映射(OSEM:object/search engine mapping)与一个Java持久层框架.Compass包括: * 搜索引擎抽象层(使用Lucene搜索引荐), *
Mustru是一个桌面搜索引擎,基于Lucene、Wordnet、Lingpipe、GATE和Berkeley DB等开源项目开发。能够对本地文件系统的多个目录进行索引,然后使用一个Web界面查询该索引。Mustru提供的功能包括:
Nutch 是一个开源Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。 尽管Web搜索是漫游Internet的基本要求, 但是现有web搜索引擎的数目却在下降
Hawk 搜索引擎平台 是面向中小型网站,可以定制的垂直搜索引擎平台。本搜索引擎平台目标是方便用户搭建站内搜索、某个领域的垂直搜索、以及检索个人文档以及自己关注的网站信 息的桌面搜索等应用领域。它改造
IndexTank, 一套基于Java的索引-搜索引擎实现,支持的特性包括:variables (boosts), categories (facets), faceted search, snippeting
QuickFind是一个跨平台的Java应用程序,用于在你的电脑中搜索文件。它的唯一目的是为了节省用户的时间,可以瞬间通过搜索所需的文件。它被设计为支持所有主要的计算机平台。用户可以安排在任何时间在选
Lucene 是一套用于全文检索和 搜寻 的 开源 程式库 ,由Apache软件基金会支持和提供。Lucene提供了一个简单确强大的应用程式接口,能够做全文索引和搜寻,在Java开发环境里Lucene是
OSS (Open Search Server) 是一个用 Java 开发的搜索引擎服务器,基于 Lucene 、ZK 和 Tomcat 等开源软件架构。 项目主页: http://www
Zoie 是一个基于Apache Lucene 构建的实时搜索和索引系统。特性: 实现快速的lucene docid 到 uid 的映射 fast uid to lucene docid mapping
Piranha是一个开源搜索系统,它能够真正"学习"你所要查找的是什么.Red-Piranha 可作为你桌面系统(Windows,Linux与Mac)的个人搜索引擎,或企业内部网搜索引擎,或为你的网站提供搜索功能,或作为一个P2P搜索引擎
Coreseek/sphinx全文检索的了解 概述: 全文检索是一种将文件中所有文本与检索项匹配的文字资料检索方法,全文检索是将存储于数据库中整本书、整篇文章中的任意内容信息查找出来的检索。它可以根据需要获得全文中有关章
全文检索(oracle text) Oracle Text使Oracle9i具备了强大的文本检索能力和智能化的文本管理能力,Oracle Text是Oracle9i采用的新名称,在oracle8/8i中被称为oracle
public class OrderListAction ectends Action//struts依赖于java 2) Struts2提供了拦截器,利用拦截器可以进行AOP编程,实现如权限拦截等功能 3) S
zettair 是全文检索界鼎鼎大名的大牛:Justin Zobel,以他的研究成果为基础的全文检索实验系统。 Zobel可能是业界第一个系统提出倒排索引差分压缩算法的人,倒排列表的压缩大大提高了