假如我们建了一个web站点或者是一个应用程序,你就可能会需要添加搜索功能(因为这太有必要了),而事实上让搜索跑起来是有难度的,我们不仅想要搜索的速度快,而且还要安装方便(最好是无痛安装),另外模式定义要非常自由(schemafree),可以通过HTTP以JSON格式的数据来进行索引,服务器必须是一直可用的(HA高可用,这个不能丢),从一台机器能够扩展到成千上万台,然后搜索必须是实时的(real-time),使用起来一定要简单、支持多租户,我们需要一整套的解决方案。elasticsearch 的目标是解决上面的所有问题以及更多。它是开源的(Apache2协议),分布式的,RESTful的,构建在HYPERLINK"http://lucene.apache.org/"ApacheLucene之上的的搜索引擎.ElasticSearch是一个基于Lucene构建的开源,分布式,RESTful搜索引擎。
百度Elasticsearch大数据分析实践百度大数据部高攀2015年10月17日大纲背景介绍典型应用场景遇到的问题及经验分享对ES的优化与改进后期计划ES是啥有谁在用面向搜索(forfulltextsearch) 结构化数据分析文本数据分析ES在百度现状2013年10月开始使用目前覆盖百度内部20多个业务线包括casio、云分析、网盟、预测、文库、直达号、钱包、风控等单集群每天导入30TB+数据,总共每天60TB+单集群最大100台机器,200个ES节点共使用近300台机器
Elasticsearch是一个开源的分布式实时搜索与分析引擎,支持云服务。它是基于Apache Lucene搜索引擎的类库创建的,提供了全文搜索能力、多语言支持、专门的查询语言、支持地理位置服务、基于上下文的搜索建议、自动完成以及搜索片段(snippet)的能力。Elasticsearch支持RESTful的API,可以使用JSON通过HTTP调用它的各种功能,包括搜索、分析与监控。下面是讲述了elasticsearch分布式搜索配置文件各类参数的具体含义。