【Python3.7】Mecabの導入方法


Mecabの動作テストのために、Windows・Python3.7の環境で試してみました。

導入方法

Mecabのインストール

公式のexeは32Bit版しか無いので、有志の野良ビルドを利用します。
ダウンロードはこちら

ダウンロードしたexeを実行し、インストールを行います。

インストールした場所にあるbinフォルダ内をCMDで開きます。
mecabコマンドを起動して、何か文章を打ち、出力が得られれば、動作しています。
※ UTF-8で出力されているため、現在は文字化けしていますが、正常にインストールされている事が確認できれば問題ありません。

実行結果
C:\Program Files\MeCab\bin>mecab
東京は今日も暑いです。
東京は今日も暑い        險伜捷,荳€闊ャ,*,*,*,*,*
ナ       蜷崎ゥ・蝗コ譛牙錐隧・邨・ケ・*,*,*,*
キ       險伜捷,荳€闊ャ,*,*,*,*,*
B       蜷崎ゥ・蝗コ譛牙錐隧・邨・ケ・*,*,*,*
EOS

Pythonのための利用設定

下記2つのモジュールを取得する
pip install ipykernel
pip install mecab-python-windows

Pythonで試してみる。

Pythonで実行してみましょう。
```py:MeCab実行
import MeCab

tagger = MeCab.Tagger("-Ochasen")
result = tagger.parse("東京は今日も暑いです。")
print(result)
```

実行結果
>>> print(result)
東京    トウキョウ      東京    名詞-固有名詞-地域-一般
は      ハ      は      助詞-係助詞
今日    キョウ  今日    名詞-副詞可能
も      モ      も      助詞-係助詞
暑い    アツイ  暑い    形容詞-自立     形容詞・アウオ段        基本形
です    デス    です    助動詞  特殊・デス      基本形
。      。      。      記号-句点
EOS

見事、出力されました。

出力フォーマットの指定について

-Oyomi (ヨミ付与)
-Ochasen (ChaSen互換)
-Odump (全情報を出力)

参考URL