Anaconda仮想環境でconda installを使ってMeCabを使えるようにする


まえがき

以前も触れた書籍「すぐに使える!業務で実践できる! PythonによるAI・機械学習・深層学習アプリのつくり方 TensorFlow2対応」でMeCabが登場したので、早速インストールしようとしてみました。しかし、有名かつ古参のソフトウェアということで、ネット上の情報の時間軸が散らばっていて、結構導入に手こずりました。

同じようにAnaconda仮想環境でconda installを使いMeCabを導入したい方の参考になれば、ということで残しておきます。

実行環境

  • Anaconda3(64bit)
  • Python3.8

導入方法

まずはこちらのサイトを参考にしつつMeCabのインストールと、Path通しを行ってください。サイト中にもありますが、デフォルトのshift_jisではなくutf-8でインストールしないと後でエラーを吐くのでご注意ください。

次にconda installを行いますが、自分がデフォルトとconda-forgeのチャンネルで探す限り、"mecab-python-windows"も"mecab-python3"も"mecab"も見つけることができませんでした。

そこでAnacondaの公式サイトで検索をかけたところ、このパッケージがでてきました。こちらに記載してあるコマンドの

conda install -c mzh mecab-python3

でインストールしたところ、以下のコードが実行できました。

import MeCab

# MeCabオブジェクトの生成
tagger = MeCab.Tagger()
# 形態素解析
result = tagger.parse("紹介されているパッケージや環境がばらついていて、非常に苦労しました。")
print(result)
出力
紹介  名詞,サ変接続,*,*,*,*,紹介,ショウカイ,ショーカイ
さ 動詞,自立,*,*,サ変・スル,未然レル接続,する,サ,サ
れ 動詞,接尾,*,*,一段,連用形,れる,レ,レ
て 助詞,接続助詞,*,*,*,*,て,テ,テ
いる  動詞,非自立,*,*,一段,基本形,いる,イル,イル
パッケージ 名詞,一般,*,*,*,*,パッケージ,パッケージ,パッケージ
や 助詞,並立助詞,*,*,*,*,や,ヤ,ヤ
環境  名詞,一般,*,*,*,*,環境,カンキョウ,カンキョー
が 助詞,格助詞,一般,*,*,*,が,ガ,ガ
ばらつい    動詞,自立,*,*,五段・カ行イ音便,連用タ接続,ばらつく,バラツイ,バラツイ
て 助詞,接続助詞,*,*,*,*,て,テ,テ
い 動詞,非自立,*,*,一段,連用形,いる,イ,イ
て 助詞,接続助詞,*,*,*,*,て,テ,テ
、 記号,読点,*,*,*,*,、,、,、
非常  名詞,形容動詞語幹,*,*,*,*,非常,ヒジョウ,ヒジョー
に 助詞,副詞化,*,*,*,*,に,ニ,ニ
苦労  名詞,サ変接続,*,*,*,*,苦労,クロウ,クロー
し 動詞,自立,*,*,サ変・スル,連用形,する,シ,シ
まし  助動詞,*,*,*,特殊・マス,連用形,ます,マシ,マシ
た 助動詞,*,*,*,特殊・タ,基本形,た,タ,タ
。 記号,句点,*,*,*,*,。,。,。

相変わらずものすごい精度で驚くばかりです。

あとがき

書籍の方には「MeCabはWindowsだとセットアップが大変なので、VirtualBox上で仮想環境を作って導入してね」とありましたが、確かにそこそこ大変でした。

集合知に感謝。

参考サイト様(アルファベット順)