ElasticSearch 使用心得

jopen 9年前

版本 ES 1.7.1   pyes 0.99.6


  • ES 2.x版本不兼容_head等插件,所以先用1.7.1(这和Python2/3类似)
  • pyes 0.99.5 没有FunctionScoreQuery.FieldValueFactor, 0.99.6有
  • RTF(免配置的中文搜索) 
  • 插件head:  图形化web管理页面

中文分词插件--IK


  1. 编译好的zip文件解压到  ES根目录/plugin/analyzerIK </li>
  2. 拷贝IK的config/ik 到 ES根目录/config/
  3. ES根目录/config/elasticsearch.yml  中追加
  4. </ol>
    index.analysis.analyzer.default.type : "ik"  index:    analysis:      analyzer:        ik:            alias: [ik_analyzer]            type: org.elasticsearch.index.analysis.IkAnalyzerProvider        ik_smart:            type: ik            use_smart: true        ik_max_word:            type: ik            use_smart: false
    </span>

    重启ES即可

    • RTF版本有编译好的,但我移植到自己的ES上就报错了,但官方给出的解决方案我是醉了(见https://github.com/medcl/elasticsearch-analysis-ik/issues/48)
    • 测试 http://localhost:9200/your_index/_analyze?analyzer=ik&pretty=1&text=我要信耶稣,得永生

    查询 | pyes使用


    • 搜索结果的展示,最要关心的莫过于 排序

    • ES的全文搜索,默认依据_score降序排

    • _score的算法,一般来讲了解即可,ES暴露出API来给我们调整score  TF/IDF... 详见http://blog.csdn.net/dm_vincent/article/category/2718099
    • boosting in query-time是常用的干预手段
    • FunctionScoreQuery可以让我们更加大力度影响最终score,也就是排序
    • FunctionScoreQuery.FieldValueFactor  可以用文档中某一字段来影响score


    来自: http://my.oschina.net/niuqingshan/blog/547491