0推荐
13K 浏览

lucene索引_创建_域选项和lucene索引_的删除、更新.

lucene索引_创建_域选项和lucene索引_的删除、更新.
jopen 9年前   
0推荐
18K 浏览

从概念理解Lucene的Index(索引)文档模型

Lucene主要有两种文档模型:Document和Field,一个Document可能包含若干个Field。
jopen 9年前   
0推荐
17K 浏览

lucene创建索引初步和搜索初步

Lucene是一个全文搜索框架,而不是应用产品。因此它并不像www.baidu.com 或者google Desktop那么拿来就能用,它只是提供了一种工具让你能实现这些产品。
jopen 9年前   
0推荐
45K 浏览

垂直搜索引擎中的分词系统

国内垂直领域的电商或者信息分享类应用都处于高速发展期,其对内容快速搜索的需求越来越强烈,对于能适应自己业务应用的搜索引擎解决方案也越来越 重视。同时,通用的可选开源搜索引擎框架或解决方案也越...
jopen 9年前   
0推荐
14K 浏览

Elasticsearch 的交互库:Elastomer-Client

Elastomer-Client 为 ElasticSearch API endpoint 提供一个一对一的映射。API 通过你想要实现的来分解为逻辑部分和访问,每一个逻辑部分代表一个客户端类。
0推荐
34K 浏览

基于IKAnalyzer实现一个Elasticsearch中文分词插件

虽然Elasticsearch有原生的中文插件elasticsearch-analysis-smartcn(实际上是lucence的org.apache.lucene.analysis.cn.s...
0推荐
25K 浏览

13 款开源的全文搜索引擎

主要介绍13款现有的开源搜索引擎,你可以将它们用在你的项目中以实现检索功能。
yg3n 9年前   
0推荐
36K 浏览

Tomcat 7.0 配置 solr 4.7.2 全过程

Win7 Tomcat 7.0 配置 solr 4.7.2 全过程
m45y 9年前   
0推荐
64K 浏览

为ElasticSearch添加HTTP基本认证

ES的HTTP连接没有提供任何的权限控制措施,一旦部署在公共网络就容易有数据泄露的风险,尤其是加上类似 elasticsearch-head 这样友好的前端界面,简直让你的数据瞬间裸奔在黑客的眼...
0推荐
20K 浏览

ElasticSearch 自动部署工具:Raigad

Raigad 是 ElasticSearch 备份,回复,自动部署和集中化配置管理工具(进程)。
x286 9年前   
0推荐
10K 浏览

高性能的全文检索工具包:jsearch

jsearch是一个高性能的全文检索工具包,基于倒排索引,基于java8,类似于lucene,但更轻量级。
bcf2 9年前   
0推荐
15K 浏览

sphinx支持中文检索(安装coreseek)

sphinx支持中文检索(安装coreseek)
jopen 9年前   
0推荐
31K 浏览

分布式搜索引擎Elasticsearch安装配置

本文主要介绍了elasticsearch,还介绍了elasticsearch的安装配置,包括插件的安装使用。对于新入门的同学应该很有帮助,对于已经熟悉的同学也不失为一篇安装教程,尤其是插件安装。
yn6e 9年前   
0推荐
139K 浏览

Elasticsearch学习笔记

首先,为什么要使用Elasticsearch?最开始的时候,我们的项目仅仅使用MySQL进行简单的搜索,然后一个不能索引的like语句,直接拉低MySQL的性能。后来,我们曾考虑过sphinx,...
0推荐
19K 浏览

Sphinx+Mysql+Php 12亿DNS数据秒查

最近得到一个接近12亿的全球ns节点的数据,本来想用来做一个全国通过dns反查域名然后进行全国范围的网站收集和扫描的,后来发现网站的数量不是很准确,加上一个人的精力和财力实在难以完成这样一个庞...
jopen 9年前   
0推荐
39K 浏览

通过HBase Observer同步数据到ElasticSearch

众所周知,HBase是一个分布式的存储体系,数据按照RowKey分成不同的Region,再分配给RegionServer管理。但是 RegionServer只承担了存储的功能,如果Region能...
0推荐
59K 浏览

ES(Elastic Search)针对日志场景(读测试)

对Elastic Search在日志查询场景下的性能有一个比较直观的认识,该场景可以描述为单TermQuery、时间区间为一个小时、按照时间降序排列、查询结果支持翻页、每页两百条。
0推荐
17K 浏览

Java实现的基于模板的网页结构化信息精准抽取组件:HtmlExtractor

HtmlExtractor是一个Java实现的基于模板的网页结构化信息精准抽取组件,本身并不包含爬虫功能,但可被爬虫或其他程序调用以便更精准地对网页结构化信息进行抽取。
jopen 10年前   
0推荐
69K 浏览

ElasticSearch的部署、同步与调优

ElasticSearch是一个强大的搜索服务器,基于Apache Lucene的全文搜索引擎开发,具有高性能、分布式和零配置的优点。在当前的项目中,我们希望ES能承担亿级文档的搜索,而ES也证...
n6xb 10年前   
0推荐
16K 浏览

solr服务器配置与tomcat整合

最近找了视频学习lucene和solr,记一下怎么配置solr JDK使用的为1.7,如果用1.6貌似会提示版本低 先下载solr3.5和mmseg4j1.8.5的压缩包,下载链接在底部
dy223 10年前   
1 2 3 4 5 6 7 8 9 10

经验分享,提升职场影响力

投稿

热门问答

    热门文档