【LinuxBrew】UbuntuでMeCabのインストール


LinuxBrew を用いて Ubuntu に MeCab をセットアップします.
おそらくは Mac でも同じくできるでしょうが、検証環境がありませんので未確認です.
おそらくは何番煎じという記事でしょうがあしからず.

環境

  • LinuxBrew:
    • Homebrew 1.0.7
    • Homebrew/homebrew-core (git revision a5528; last commit 2016-11-06)
  • Ubuntu: 16.04

本体のインストール

$ brew update
$ brew install mecab

確認:

$ mecab -v
mecab of 0.996

ちゃんとインストールできたようです.

辞書のインストール

MeCab を使うには辞書が必要です.

辞書の種類や特徴は Qiita: y-ken: brewコマンドでmecab用のIPA/Juman/UniDic辞書をインストールする方法 にあります.
というか、リンク先を後から知りこのセクションいらないじゃんって…

IPA 辞書

$ brew install mecab-ipadic

オプションで文字コードの指定が可能(デフォルトはutf8)

$ mecab -d $HOME/.linuxbrew/lib/mecab/dic/ipadic
この記事を読んでいただきありがとうございます
この  連体詞,*,*,*,*,*,この,コノ,コノ
記事  名詞,一般,*,*,*,*,記事,キジ,キジ
を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
読ん  動詞,自立,*,*,五段・マ行,連用タ接続,読む,ヨン,ヨン
で 助詞,接続助詞,*,*,*,*,で,デ,デ
いただき    動詞,非自立,*,*,五段・カ行イ音便,連用形,いただく,イタダキ,イタダキ
ありがとう 感動詞,*,*,*,*,*,ありがとう,アリガトウ,アリガトー
ござい   助動詞,*,*,*,五段・ラ行特殊,連用形,ござる,ゴザイ,ゴザイ
ます  助動詞,*,*,*,特殊・マス,基本形,ます,マス,マス
EOS

Juman 辞書

$ brew install mecab-jumandic

同じくオプションで文字コードの指定が可能(デフォルトはutf8)

$ mecab -d $HOME/.linuxbrew/lib/mecab/dic/jumandic/
隣の客はよく柿食う客だ
隣 名詞,普通名詞,*,*,隣,となり,代表表記:隣り
の 助詞,接続助詞,*,*,の,の,*
客 名詞,普通名詞,*,*,客,きゃく,漢字読み:音 代表表記:客
は 助詞,副助詞,*,*,は,は,*
よく  形容詞,*,イ形容詞アウオ段,基本連用形,よい,よく,代表表記:良い
柿 名詞,普通名詞,*,*,柿,かき,代表表記:柿
食う  動詞,*,子音動詞ワ行,基本形,食う,くう,代表表記:食う
客 名詞,普通名詞,*,*,客,きゃく,漢字読み:音 代表表記:客
だ 判定詞,*,判定詞,基本形,だ,だ,*
EOS

UniDic 辞書

$ brew install mecab-unidic
$ mecab -d $HOME/.linuxbrew/lib/mecab/dic/unidic/
東京特許許可局
東京  トーキョー トウキョウ トウキョウ 名詞-固有名詞-地名-一般       
特許  トッキョ    トッキョ    特許  名詞-普通名詞-一般      
許可  キョカ   キョカ   許可  名詞-普通名詞-サ変可能        
局 キョク   キョク   局 名詞-普通名詞-助数詞可能     
EOS