Senna 是一个可嵌入式的全文搜索引擎,可用在各种不同的脚本语言和数据库中。Senna 是一个倒排索引的引擎,并结合最好的n元语法的索引和词索引,以实现快速,精确的搜索。虽然塞纳是相当紧凑的代码是可扩展性不够,处理大量的数据和查询。
Groonga 是一个快速、准确、基于倒排索引的全文搜索引擎。新注册的文件立即显示在搜索结果中,并且在更新的时候没有只读锁定。这些特性使得可以将其用作一个性能优越的实时应用程序。 它还是一个面向列的数
为您的客户端应用程序提供一个简单的全文搜索引擎。类似 Solr。示例代码: //定义索引 var idx = lunr(function () { this.field('title', { boost:
看这篇文章前推荐阅读相关的如下文章: 使用API登录知乎并获得token 知乎Live全文搜索之模型设计和爬虫实现 知乎Live全文搜索之模型接口 抓取话题信息 给新增的Topic提供数据。在parse
xapian 和 scws 开发的全文搜索引擎解决方案,提供 PHP 语言的开发接口。支持海量数据高速检索,功能强大,简单易用,是 PHP 开发的 WEB 应用的全文检索首选解决方案之一! 本项目
Apache Solr 是一个开源的搜索服务器。Solr 使用 Java 语言开发,主要基于 HTTP 和 Apache Lucene 实现。Apache Solr 中存储的资源是以 Document
是一个基于SQL的全文检索引擎,可以结合MySQL,PostgreSQL做全文搜索,它可以提供比数据库本身更专业的搜索功能,使得应用程序更容易实现专业化的全文检索。 Sphinx 特别为一些脚本语言设计搜索API接口,如PHP
Apache Lucy 是一个全文搜索引擎库,使用 C 语言编写,主要面向一些动态语言,目前提供 Perl 语言的绑定。目前该项目还只是 Apache 基金会的孵化项目。 Apache Lucy 0
Apache Lucy 是一个全文搜索引擎库,使用 C 语言编写,主要面向一些动态语言,目前提供 Perl 语言的绑定。相当于是 C 语言版的 Lucene 。 Apache Lucy 0.4.4
ftserver是一个轻量全文搜索服务器,使用英文规则处理英文,使用中文规则处理中文,不需要切割中文为单词,可以支持中文字的任意排列,完全索引,轻松处理古文古诗词,写意句子不影响搜索,不依赖词库,搜索中文不漏词。可
ftserver是一个使用英文规则处理英文,使用中文规则处理中文的全文搜索服务器,不需要切割中文为单词,可以支持中文字的任意排列,轻松处理古诗词,写意句子不影响搜索,不依赖词库。 使用独立的全文搜索引擎,可分离,比同类产品更容易按需定制,可以完全嵌入到各种应用内部。
Apache Solr 5.5.0 发布,Solr是一个高性能,采用Java开发,基于Lucene的全文搜索服务器。文档通过Http利用XML加到一个搜索集合中。查询该集合也是通过 http收到一个XML/JSO
Recoll 是一个基于Xapian的个人全文桌面搜索工具。它提供了一个易于使用,功能丰富,易于管理一个基于Qt GUI界面。支持以下文件格式:Text, HTML, PDF, PostScript,
Groonga 是一个快速、准确、基于倒排索引的全文搜索引擎。新注册的文件立即显示在搜索结果中,并且在更新的时候没有只读锁定。这些特性使得可以将其用作一个性能优越的实时应用程序。 它还是一个面向列的数
Groonga 是一个快速、准确、基于倒排索引的全文搜索引擎。新注册的文件立即显示在搜索结果中,并且在更新的时候没有只读锁定。这些特性使得可以将其用作一个性能优越的实时应用程序。 它还是一个面向列的数
Recoll是一个基于Xapian的个人全文桌面搜索工具。它提供了一个易于使用,功能丰富,易于管理的界面与基于Qt的图形用户界面。支持文本,HTML,PDF的PostScript,微软Word,Ope
DocFetcher 是一个桌面搜索应用程序。它可以让您在您的计算机上全文搜索文件的内容。您可以认为它是针对您的本地文档库的一个Google搜索。 此版本增加了一个重要的错误修正:在Mac OS
mongodb 解决 全文搜索是个不小的问题 可以用 正则匹配 但是效率很低 往往到大数据量的搜索的时候就会出现 查询超时等现象 当然也可以用官方的做法(在mongodb的文档类型中加字段,存分词结果
我本来在台上习惯把手背到后面,后来 5.20 之后,网上有我在台上的照片,两个胳膊背到后面像无臂人。 现在正式开始,这个海报没什么,就是做一个噱头。我还健在,而且没有得绝症。
JDesktopSearch是一个基于Apache Lucene实现的桌面搜索引擎。它能够索引HTML、XML、OpenOffice、MS Word和PDF文档。其它类型的文件只索引文件名。