elasticsearch1.7.2 ik分詞器の取り付け

2147 ワード

ネット上でいろいろな案を試しても効かない!
最後に私に使われたに違いない.記録して、他の人を助けてほしい!
ik分詞器アドレス:https://github.com/medcl/elasticsearch-analysis-ik 
1、elasticsearch-analysis-ik-1.4.1.をダウンロードするzip
2、解凍して、ディレクトリに入る:コマンドライン実行:mvn compile package(マシンにmavenがインストールされていることを確認する)
 
3、targetreleasesに入るelasticsearch-analysis-ik-1.4.1.zipこのファイルをサーバにコピーする7.2のインストールディレクトリ、pluginsの下にanalysis-ikというフォルダがない場合は作成してください
4、unzipでelasticsearch-analysis-ik-1.4.1.を解凍するzipこのファイルはanalysis-ikというフォルダにあります(最も重要なのは、他のチュートリアルにはこのステップがありません.そうしないと、クラスのエラーが見つかりません)
 
5、$ES_に入るHOME/configディレクトリの下で、ネイティブD:javastudyeselasticsearch-analysis-ik-1.4.1configの下のikこのファイルをディレクトリにコピーします(つまり、分詞器をこのディレクトリにコピーしました)
6、このesのプロファイルの末尾追加:$ES_HOME/config/elasticsearch.yml 
index:
  analysis:
    analyzer:
      ik:
          alias: [ik_analyzer]
          type: org.elasticsearch.index.analysis.IkAnalyzerProvider
      ik_max_word:
          type: ik
          use_smart: false
      ik_smart:
          type: ik
          use_smart: true
index.analysis.analyzer.default.type: ik

7、再起動es
クローズコマンド:curl-XPOSThttp://localhost:19200/_cluster/nodes/_shutdown
8、検査を行う:
curl 'http://localhost:9200/index/_analyze?analyzer=ik_max_word&pretty=true' -d' 
{ 
    "text":"         " 
} 
'
{
  "tokens" : [ {
    "token" : "text",
    "start_offset" : 10,
    "end_offset" : 14,
    "type" : "ENGLISH",
    "position" : 1
  }, {
    "token" : "       ",
    "start_offset" : 17,
    "end_offset" : 24,
    "type" : "CN_WORD",
    "position" : 2
  }, {
    "token" : "  ",
    "start_offset" : 24,
    "end_offset" : 26,
    "type" : "CN_WORD",
    "position" : 3
  } ]
}

ik_max_word:テキストを最も細かく分割します.例えば、「中華人民共和国国歌」を「中華人民共和国、中華人民共和国、中華人民共和国、中華、華人、人民共和国、人民、人民、人、民、共和国、共和国、和、国国、国歌」に分割し、可能な限りの組み合わせをします.
ik_smart:最も太い粒度の分割をします.例えば、「中華人民共和国国歌」を「中華人民共和国、国歌」に分割します.
    
戻り値: