基于Solr搜索服务器的全文检索

jopen 11年前

1:何为全文检索

全 文检索是一种将文件中所有文本与检索关键词匹配的文字资料检索方法,比如我们将一本书的作者、出版日期、出版社、章节、章节内容都存于数据库中,那么我们 输入任何一个词,可以将该书中任意与该此匹配的信息检索出来,我们输入“张三”,可能我们找到的是作者张三,也可能是某章节的一段内容中含有张三。我们在 日常生活中用的最多的全文检索莫过于使用Windows的搜素功能,不信?没注意?现在来试试吧!

2:什么是solr

solr是基于Lucene内核的一种搜素服务器,我们都知道Lucene是用来做索引的,solr在Lucene基础上做了很多封装和优化。我们在solr上可以随时配置、扩展我们data schema,自由决定我们的field的存储和索引,配置我们的分词策略,查询我们需要的数据格式。我们来看看solr的架构吧:

基于Solr搜索服务器的全文检索

Solr4.x还有一套非常烧包的UI管理界面,如下:

基于Solr搜索服务器的全文检索

3:solr能干些什么

基于任何字段进行分词检索;

数据分页;

基于任何字段进行统计;

关键词高亮;

分布式计算和存储;(4.x以上)