elasticsearch1.7.2 ik分詞器の取り付け
2147 ワード
ネット上でいろいろな案を試しても効かない!
最後に私に使われたに違いない.記録して、他の人を助けてほしい!
ik分詞器アドレス:https://github.com/medcl/elasticsearch-analysis-ik
1、elasticsearch-analysis-ik-1.4.1.をダウンロードするzip
2、解凍して、ディレクトリに入る:コマンドライン実行:mvn compile package(マシンにmavenがインストールされていることを確認する)
3、targetreleasesに入るelasticsearch-analysis-ik-1.4.1.zipこのファイルをサーバにコピーする7.2のインストールディレクトリ、pluginsの下にanalysis-ikというフォルダがない場合は作成してください
4、unzipでelasticsearch-analysis-ik-1.4.1.を解凍するzipこのファイルはanalysis-ikというフォルダにあります(最も重要なのは、他のチュートリアルにはこのステップがありません.そうしないと、クラスのエラーが見つかりません)
5、$ES_に入るHOME/configディレクトリの下で、ネイティブD:javastudyeselasticsearch-analysis-ik-1.4.1configの下のikこのファイルをディレクトリにコピーします(つまり、分詞器をこのディレクトリにコピーしました)
6、このesのプロファイルの末尾追加:$ES_HOME/config/elasticsearch.yml
7、再起動es
クローズコマンド:curl-XPOSThttp://localhost:19200/_cluster/nodes/_shutdown
8、検査を行う:
ik_max_word:テキストを最も細かく分割します.例えば、「中華人民共和国国歌」を「中華人民共和国、中華人民共和国、中華人民共和国、中華、華人、人民共和国、人民、人民、人、民、共和国、共和国、和、国国、国歌」に分割し、可能な限りの組み合わせをします.
ik_smart:最も太い粒度の分割をします.例えば、「中華人民共和国国歌」を「中華人民共和国、国歌」に分割します.
戻り値:
最後に私に使われたに違いない.記録して、他の人を助けてほしい!
ik分詞器アドレス:https://github.com/medcl/elasticsearch-analysis-ik
1、elasticsearch-analysis-ik-1.4.1.をダウンロードするzip
2、解凍して、ディレクトリに入る:コマンドライン実行:mvn compile package(マシンにmavenがインストールされていることを確認する)
3、targetreleasesに入るelasticsearch-analysis-ik-1.4.1.zipこのファイルをサーバにコピーする7.2のインストールディレクトリ、pluginsの下にanalysis-ikというフォルダがない場合は作成してください
4、unzipでelasticsearch-analysis-ik-1.4.1.を解凍するzipこのファイルはanalysis-ikというフォルダにあります(最も重要なのは、他のチュートリアルにはこのステップがありません.そうしないと、クラスのエラーが見つかりません)
5、$ES_に入るHOME/configディレクトリの下で、ネイティブD:javastudyeselasticsearch-analysis-ik-1.4.1configの下のikこのファイルをディレクトリにコピーします(つまり、分詞器をこのディレクトリにコピーしました)
6、このesのプロファイルの末尾追加:$ES_HOME/config/elasticsearch.yml
index:
analysis:
analyzer:
ik:
alias: [ik_analyzer]
type: org.elasticsearch.index.analysis.IkAnalyzerProvider
ik_max_word:
type: ik
use_smart: false
ik_smart:
type: ik
use_smart: true
index.analysis.analyzer.default.type: ik
7、再起動es
クローズコマンド:curl-XPOSThttp://localhost:19200/_cluster/nodes/_shutdown
8、検査を行う:
curl 'http://localhost:9200/index/_analyze?analyzer=ik_max_word&pretty=true' -d'
{
"text":" "
}
'
{
"tokens" : [ {
"token" : "text",
"start_offset" : 10,
"end_offset" : 14,
"type" : "ENGLISH",
"position" : 1
}, {
"token" : " ",
"start_offset" : 17,
"end_offset" : 24,
"type" : "CN_WORD",
"position" : 2
}, {
"token" : " ",
"start_offset" : 24,
"end_offset" : 26,
"type" : "CN_WORD",
"position" : 3
} ]
}
ik_max_word:テキストを最も細かく分割します.例えば、「中華人民共和国国歌」を「中華人民共和国、中華人民共和国、中華人民共和国、中華、華人、人民共和国、人民、人民、人、民、共和国、共和国、和、国国、国歌」に分割し、可能な限りの組み合わせをします.
ik_smart:最も太い粒度の分割をします.例えば、「中華人民共和国国歌」を「中華人民共和国、国歌」に分割します.
戻り値: