Mac OS X(10.9)にMecabとCabochaをいれて形態素解析から係り受けまで


こちらの記事を参考にいれたのですが文字化けにはまったので共有しておきます。

最初のポイント

  • mecabも辞書もともにutf8を指定してconfigureする必要がある
command
wget https://mecab.googlecode.com/files/mecab-0.996.tar.gz
tar zxvf mecab-0.996.tar.gz
cd mecab-0.996
./configure --enable-utf8-only
make
make check
sudo make install

IPA辞書もいれます。

command
wget https://mecab.googlecode.com/files/mecab-ipadic-2.7.0-20070801.tar.gz
tar zxvf mecab-ipadic-2.7.0-20070801.tar.gz
cd mecab-ipadic-2.7.0-20070801
./configure --with-charset=utf8
make
make check
sudo make install

動作確認は参照元の記事をご覧ください。
mecabコマンドで文章の形態素解析がおこなえるようになります。