Elasticsearchカスタム辞書ホット更新スキーム


IK分詞器のインストール
まずIK分詞器を取り付けます.参考:https://blog.csdn.net/weixin_44062339/article/details/85059252
カスタム辞書
今、ネットのホットワードが多く、一定の時間ごとにネットのホットワードが現れます.しかし、IK分詞をそのまま使うと、これらの語を認識できません.例:
curl -XGET 'http://hadoop01:9200/_analyze?pretty&analyzer=ik_max_word' -d '
     ,  666

Elasticsearch自定义词库热更新方案_第1张图片 IKはネットレッドの語彙を認識していない.ikの主辞書には「鉄さん、大丈夫」という言葉がないので、分割されました.IKのプロファイルの変更:ESディレクトリ/plugins/ik/config/ik/IKAnalyzer.cfg.xmlの変更構成は次のとおりです.

  
  
    IK Analyzer     
        
    custom/my.dic     
     
    ext_stopword.dic
     
    192.168.0.1/stopworld.di
    
    


my.diに追加:古い鉄、故障していないElasticsearch自定义词库热更新方案_第2张图片、それからesを再起動します;実行中:curl-XGET'http://hadoop01:9200/_analyze?pretty&analyzer=ik_max_word'-d'老鉄は故障せず、666をダブルクリックしますが、上の操作は再起動する必要があります.上のステップは辞書を更新するだけで、いわゆるホット更新ではありません.いわゆるホット更新辞書は、esを再起動しない前提で完成しなければならない.
辞書のホット・アップデート
1、tomcatをダウンロードし、リモート辞書のコンテナとしてtomcatで辞書/webapp/ROOTを構成する必要がある.
vim hot.dic

2、tomcatが起動した後、アクセスできるかどうかをテストする.
3、ikの構成を変更する:IKAnalyzer.cfg.xml加入http://hadoop03:8080/hot.dic次のようになります.

        IK Analyzer     
        
        custom/my.dic
         
        
        
        http://hadoop03:8080/hot.dic
        
        


4、hot.の更新dicの後、esには次の情報が出力されていることがわかります.Elasticsearch自定义词库热更新方案_第3张图片では、Elasticsearchカスタム辞書のホット更新が実現されます.