[NLP]Konpy,Mecab-koインストール(ウィンドウベース)


NLP韓国語では形態素分析器konlpyとMecabが必要で、Windows環境で使用でき、インストールプロセスが可能です.

JPypeのインストール


まずkonlyはJavaで実装されたモジュールで、Pythonで使用するにはjavaとjpypeが必要です.
JAva jdkインストールが異なる(openJDK1.8インストール)👈文章に書く.
https://www.lfd.uci.edu/~gohlke/pythonlibs/#jpype
上記のリンクでは、使用するPythonバージョンに適したファイルを入手できます.
私は3.7版を使っているので、下とスクリーンショットでファイルを受け取りました.
Windowsターミナルまたはcmdウィンドウを開き、受け取ったインストールファイルのパスに移動し、pythonライブラリをインストールします.(condaを使用している場合はconda上)
pip install .\JPype1-1.3.0-cp37-cp37m-win_amd64.whl

インストールが完了したら、上図のようにします.

konlpyのインストール


pythonでkonlpyを使用する準備ができている場合は、インストールできます.
私の基準はconda仮想環境にインストールすることです.
pip install konlpy

konlpyテスト

from konlpy.tag import Okt
tok = Okt()
tok.pos("테스트입니다.")

Mecab-koのインストール


mecab-ko-msvcのインストール


公式には、ウィンドウにMecabをインストールすることをサポートしています.
mecab-ko-msvc releases 👈 このリンクにアクセスすると、最新のreleaseバージョンが得られます.
のスクリーンショットに示すように、zipファイル(ビット環境に適しています)を受信できます.
圧縮ファイルは他のパスではありません(他のパスに割り当てることもできます)が、複雑です.👉 リファレンス)Cドライブの真下にmecabフォルダを作成
mkdir C:/mecab
上で受け取ったzipファイルを作成したmecabフォルダに移動し、フォルダを作成せずにすぐに解凍します.

mecab-ko-dic-msvcのインストール


上のmsvcのほかにdic-msvcが必要です.
mecab-ko-dic-msvc releases 👈 このリンクにアクセスすると、releasesが上と馬賛枝であることを確認し、最新バージョンで受信します.
ビットと同様にzipファイルを受信すると、C:/mecabフォルダにファイルを移動し、フォルダを作成せずに解凍します.

python whlのインストール


Python用(mecab-python-msvc releases)👈リンクに移動するには、環境に応じてwhlファイルを受信してインストールします.
python 3.7を使用しているので、私が受け取ったバージョンは3.7用の64 bitです.

ダウンロードしたwhlファイルをインストール


受け取ったファイルをJpypeなどのPythonライブラリとしてインストールします.

Mecabテスト

import MeCab
m = MeCab.Tagger()
m.parse("안녕하세요. 테스트 입니다요.")

関連項目:https://lsjsj92.tistory.com/612
関連項目:https://uwgdqo.tistory.com/363
次のリンク:https://github.com/yeontaek/BERT-MECAB-Korean-Model