Nutch 是一个开源Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。 尽管Web搜索是漫游Internet的基本要求, 但是现有web搜索引擎的数目却在下降
Egothor是一个用Java编写的开源而高效的全文本搜索引擎。借助Java的跨平台特性,Egothor能应用于任何环境的应用,既可配置为单独的搜索引擎,又能用于你的应用作为全文检索之用。 主要特性 采用Java开发,实现跨平台支持
OSS (Open Search Server) 是一个用 Java 开发的搜索引擎服务器,基于 Lucene 、ZK 和 Tomcat 等开源软件架构。 Open Search Server 1
OSS (Open Search Server) 是一个用 Java 开发的搜索引擎服务器,基于 Lucene 、ZK 和 Tomcat 等开源软件架构。 Open Search Server 1
OSS (Open Search Server) 是一个用 Java 开发的搜索引擎服务器,基于 Lucene 、ZK 和 Tomcat 等开源软件架构。 Lucene 是一套用于全文检索和 搜寻
从一个练手项目开始到搜索引擎行业的巨头,Lucene 项目已经在 Apache 组织整整 10 年了。2001年9月18日,Jason Van Zyl 首次将 Doug Cutting 的 Lucene
Terrier 是一个用来快速开发Web、企业内部网、桌面搜索引擎的软件,是一个模块和的平台用来构建大规模的信息获取应用,提供索引和数据获取功能,提供一个桌面搜索应用。 项目主页: http://www
robot; import java.io.IOException; import java.util.LinkedList; import java.util.List; import java.util.Queue;
起点R3企业级搜索引擎是起点软件提供的企业搜索解决方案,支持企业环境下的数据访问控制(ACL),能够通过定义用户数据访问权限来控制检索数据的安全。 R3是一个强大的,高性能的JAVA企业级搜索引擎产品,R
DDH垂直搜索引擎,是目前互联网中唯一可以商业运作的垂直搜索引擎系统,由JAVA语言开发,可以运行在大规模集群中的网络信息整合系统。DDH整合Nutch(开源搜索引擎系统),UCI(网页信息抽取系统)
Lucene 最初是由Doug Cutting所撰写的,是一位资深全文索引/检索专家,曾经是V-Twin搜索引擎的主要开发者,后来在Excite担任高级系统架构设计师,目前从事 于一些INTERNET底层架构
Nutch 是一个开源Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。 尽管Web搜索是漫游Internet的基本要求, 但是现有web搜索引擎的数目却在下降
full-featured text search engine library written entirely in Java. It is a technology suitable for nearly any application
Apache Lucene 是一个高性能,全功能的全文搜索引擎库,完全用Java编写。它适用于几乎需要全文搜索功能的任何应用程序,尤其是跨平台的。 Lucene通过一个简单的API,提供了强大的功能:
Lucene:基于Java的全文检索引擎简介 文章来源http://www.chedong.com/tech/lucene.html Lucene是一个基于Java的全文索引工具包。 1. 基于Java的全文索
Lucene 最初是由Doug Cutting所撰写的,是一位资深全文索引/检索专家,曾经是V-Twin搜索引擎的主要开发者,后来在Excite担任高级系统架构设计师,目前从事 于一些INTERNET底层架构
Lucene 最初是由Doug Cutting所撰写的,是一位资深全文索引/检索专家,曾经是V-Twin搜索引擎的主要开发者,后来在Excite担任高级系统架构设计师,目前从事 于一些INTERNET底层架构
Summa是一种由java开发的,快速模块化和可扩展的搜索引擎. Summa 有如下特点: 综合搜索 . Summa 能够同时访问许多不同的数据和资料来源,并以一个统一的接口公开 模块化设计
元数据节点(Namenode)和数据节点(datanode) 18 Zookeeper介绍 18 Lucene搜索引擎 20 Minion搜索引擎 20 Lily 分布式搜索 Lily以NoSQL技术为主题,是建立在云计算上的内容仓库(content
多级Merger与自定义分区 7. GC上进行了一些优化 自 己进行内存管理,关键地方的内存对象的创建和释放Java内部自己控制,减少GC的压力(类似Hbase的Block Buffer Cache)。 不使用W