形態素分析(MeCab)について


形態素分析とは

「自然言語」(普通の言葉)を形態素にまで分割する技術のこと

例)形態素解析
「私は球場で野球します」を形態素解析した場合

私(代名詞)
は(副助詞)
球場(名詞)
で(助詞)
野球(名詞)
し(動詞)
ます(助動詞)

形態素解析:ライブラリ

形態素解析のライブラリに「MeCab」があります。
「MeCab」の特徴として、コーパス(言語や辞書の言語資料)に依存しない、汎用的な設計があげられます。
MeCabで使用できる言語はC、C#、C++、Java、Perl、Python、Ruby、R等です。

形態素解析:実装

MeCab実装(例)
import MeCab
tagger = MeCab.Tagger()
words = tagger.parse('形態素分析したい文字列')

参考文献

[1]岡谷貴之,深層学習,2015 講談社サイエンティフィク, 講談社.

[2]PythonとMeCabで形態素解析(on Windows) - Qiita