关于搜索引擎及其开发 作者:xwjbs 来自:http://blog.csdn.net/xwjbs 转载的时候请注明作者和出处。没有作者的允许,严禁用于商业利益。 托google、百度们成功
PHP是一个高效,功能强大的搜索引擎,特别适用于中小型网站。RiSearch PHP非常快,它能够在不到1秒钟内搜索5000-10000个页面。RiSearch是一个索引搜索引擎,这就意味着它先将你的网站做索引并建立一个数
Compass是一个强大的,事务的,高性能的对象/搜索引擎映射(OSEM:object/search engine mapping)与一个Java持久层框架.Compass包括: * 搜索引擎抽象层(使用Lucene搜索引荐)
Yioop! 是一个 PHP 的搜索引擎,可用于 Web 的一般用途搜索,或者可提供URL搜索以及各种文档的索引搜索,包括:HTML, PDF, DOC, PPT, RTF, RSS, XML, SVG
一个c++编写的简单的搜索引擎,它是我对全文搜索文件结构理解的一次实践,现在应该还不能用到具体的项目中,但是如果你想了解搜索引擎的原理,那它是个不错的东西。 项目主页: http://www
XQEngine 是一个基于XML文档的全文本搜索引擎,前端使用的是 XQuery 查询语言。 项目主页: http://www.open-open.com/lib/view/home/1325594717984
Nutch 是一个开源Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。 尽管Web搜索是漫游Internet的基本要求, 但是现有web搜索引擎的数目却在下降. 并
mnoGoSearch是一个功能完整的Web搜索引擎,你可以用它来在HTTP,HTTPS,FTP,NTTP服务器,本地文件和数据库文本字段之上构建搜索引擎。它内置支持XML,HTML,eml和文本文件
盘中看似无用的原始数据新的活力。 Elasticsearch每一个独立的部分都不是新创的。比如全文搜索早就已经被实现,统计系统和分布式数据库也早已存在。但是革命之处在于能将这些独立的功能结合成一个
1. 搜索引擎解密猎兔搜索 罗刚 2. 搜索引擎结构文档文本提取索引程序索引库(Lucene)搜索查询服务器(Solr)文件数据库爬虫NBA搜索 3. Lucene是什么包括 全文索引库 简单的语言解析功能
搜索引擎命令大全 -seoerboy分享-觉得好就收藏 1、双引号 把搜索词放在双引号中,代表完全匹配搜索,也就是说搜索结果返回的页面包含双引号中出现的所有的词,连顺序也必须完全匹配。百度和Google
Hawk 搜索引擎平台 是面向中小型网站,可以定制的垂直搜索引擎平台。本搜索引擎平台目标是方便用户搭建站内搜索、某个领域的垂直搜索、以及检索个人文档以及自己关注的网站信 息的桌面搜索等应用领域。它改造
Regain是一个基于Jakarta Lucene封装的搜索引擎。它能够索引和查询多种格式的文件(当前支持的格式包括:HTML、XML、Excel、Powerpoint、Word、 PDF和RTF)。
Xapian 是一个用C++编写的全文检索程序,他的作用类似于Java的lucene。尽管在Java世界lucene已经是标准的全文检索程序,但是C/C++世界并没有相应的工具,而 Xapian 则填补了这个缺憾。
SimpleSearch是专为PHP开发人员而开发的一款搜索引擎,其基于 Xapian 开发,目标是让所有PHP开发人员都很容易解决百万级数量以上的全文检索需求。 它的实现真的很简单。轻轻松松就能实现全文检索需求,它的整个过程就像你操作mysql一样简单。
搜索引擎原理 全文索引: 根据搜索结果来源的不同,全文搜索引擎可分为两类:一类拥有自己的网页抓取、索引、检索系统(Indexer),有独立的“蜘蛛”(Spider)程序、或爬虫(Crawler)、或
业的成长至关重要。 本文介绍了搜索引擎的基本原理,对搜索引擎的一些核心技术进行了介绍与深入的分析;介绍了Lucene搜索引擎工具包的架构及其基本使用;对基于开源搜索引擎包 Lucene的搜索框架Sol
代码搜索功能。谷歌最近宣布,他们从Google code移除代码搜索支持。本文将介绍一些代码搜索引擎网站。 Github is a most widely used open source
1. 基于lucene的搜索引擎 2007/07/01 2. 引言 本文用lucene和Heritrix构建了一个Web 搜索应用程序 Lucene 是基于 Java 的全文信息检索包,它目前是 Apache
http://www.kuqin.com/opensource/20080806/13483.html