Elasticsearchカスタム辞書ホット更新スキーム
2941 ワード
IK分詞器のインストール
まずIK分詞器を取り付けます.参考:https://blog.csdn.net/weixin_44062339/article/details/85059252
カスタム辞書
今、ネットのホットワードが多く、一定の時間ごとにネットのホットワードが現れます.しかし、IK分詞をそのまま使うと、これらの語を認識できません.例:
’ IKはネットレッドの語彙を認識していない.ikの主辞書には「鉄さん、大丈夫」という言葉がないので、分割されました.IKのプロファイルの変更:ESディレクトリ/plugins/ik/config/ik/IKAnalyzer.cfg.xmlの変更構成は次のとおりです.
my.diに追加:古い鉄、故障していない、それからesを再起動します;実行中:curl-XGET'http://hadoop01:9200/_analyze?pretty&analyzer=ik_max_word'-d'老鉄は故障せず、666をダブルクリックしますが、上の操作は再起動する必要があります.上のステップは辞書を更新するだけで、いわゆるホット更新ではありません.いわゆるホット更新辞書は、esを再起動しない前提で完成しなければならない.
辞書のホット・アップデート
1、tomcatをダウンロードし、リモート辞書のコンテナとしてtomcatで辞書/webapp/ROOTを構成する必要がある.
2、tomcatが起動した後、アクセスできるかどうかをテストする.
3、ikの構成を変更する:IKAnalyzer.cfg.xml加入http://hadoop03:8080/hot.dic次のようになります.
4、hot.の更新dicの後、esには次の情報が出力されていることがわかります.では、Elasticsearchカスタム辞書のホット更新が実現されます.
まずIK分詞器を取り付けます.参考:https://blog.csdn.net/weixin_44062339/article/details/85059252
カスタム辞書
今、ネットのホットワードが多く、一定の時間ごとにネットのホットワードが現れます.しかし、IK分詞をそのまま使うと、これらの語を認識できません.例:
curl -XGET 'http://hadoop01:9200/_analyze?pretty&analyzer=ik_max_word' -d '
, 666
’ IKはネットレッドの語彙を認識していない.ikの主辞書には「鉄さん、大丈夫」という言葉がないので、分割されました.IKのプロファイルの変更:ESディレクトリ/plugins/ik/config/ik/IKAnalyzer.cfg.xmlの変更構成は次のとおりです.
IK Analyzer
custom/my.dic
ext_stopword.dic
192.168.0.1/stopworld.di
my.diに追加:古い鉄、故障していない、それからesを再起動します;実行中:curl-XGET'http://hadoop01:9200/_analyze?pretty&analyzer=ik_max_word'-d'老鉄は故障せず、666をダブルクリックしますが、上の操作は再起動する必要があります.上のステップは辞書を更新するだけで、いわゆるホット更新ではありません.いわゆるホット更新辞書は、esを再起動しない前提で完成しなければならない.
辞書のホット・アップデート
1、tomcatをダウンロードし、リモート辞書のコンテナとしてtomcatで辞書/webapp/ROOTを構成する必要がある.
vim hot.dic
2、tomcatが起動した後、アクセスできるかどうかをテストする.
3、ikの構成を変更する:IKAnalyzer.cfg.xml加入http://hadoop03:8080/hot.dic次のようになります.
IK Analyzer
custom/my.dic
http://hadoop03:8080/hot.dic
4、hot.の更新dicの後、esには次の情報が出力されていることがわかります.では、Elasticsearchカスタム辞書のホット更新が実現されます.