[MeCab]Python3で使ってみる


文字学習をするにはMeCabがよいとの噂があったので利用してみた
【手順】
1.下記のMeCab本体のインストール
https://drive.google.com/uc?export=download&id=0B4y35FiV1wh7WElGUGt6ejlpVXc
2.パスを通す
set PATH=%PATH%;C:\Program Files (x86)\MeCab\bin
3.pipでインストール
py -m pip install mecab-python-windows

後はコードで検証!

#coding: UTF-8
import MeCab


# オプション
# 1. -Ochasen
# 2. -Owakati
# 3. -Oyomi
# 4.mecabrc
text = '男だろ、負けてもいいから戦うくらいの勇気をもて'
tagger = MeCab.Tagger("-Ochasen")
str_output = tagger.parse(text)
print(str_output)

実行結果

男      オトコ  男      名詞-一般
だろ    ダロ    だ      助動詞  特殊・ダ        未然形
、      、      、      記号-読点
負け    マケ    負ける  動詞-自立       一段    連用形
て      テ      て      助詞-接続助詞
も      モ      も      助詞-係助詞
いい    イイ    いい    形容詞-非自立   形容詞・イイ    基本形
から    カラ    から    助詞-接続助詞
戦う    タタカウ        戦う    動詞-自立       五段・ワ行促音便        基本形
くらい  クライ  くらい  助詞-副助詞
の      ノ      の      助詞-連体化
勇気    ユウキ  勇気    名詞-一般
を      ヲ      を      助詞-格助詞-一般
もて    モテ    もてる  動詞-自立       一段    連用形
EOS

ドラえもんの名言から使っています
githubはこちら

次は言葉の判定処理の予定。。。