appche mahoust 0.8インストールとテスト
tar.gzのインストールパッケージをダウンロードします.
住所:http://www.apache.org/dyn/closer.cgi/mahout/
ダウンロードして解凍します.インストールしたいパスにあります.
binディレクトリ下のmahotファイルを修正します.
ファイルの先頭に変数を追加します.
テスト用のデータファイルをダウンロードします.http://archive.ics.uci.edu/ml/databases/synthetic_control/synthetic_control.data
まず、hadoopが運転状態にあることを確認します.
hadoopを正常に動作させることができれば、jobを生成してインストール成功を証明します.
住所:http://www.apache.org/dyn/closer.cgi/mahout/
ダウンロードして解凍します.インストールしたいパスにあります.
binディレクトリ下のmahotファイルを修正します.
ファイルの先頭に変数を追加します.
HADOOP_HOME=hadoop
HADOOP_CONF_DIR=hadoop
ローカルのデータファイルを呼び出したいなら、hadoopを使わないとMAHOUT_を追加する必要があります.LOCALの変数テスト用のデータファイルをダウンロードします.http://archive.ics.uci.edu/ml/databases/synthetic_control/synthetic_control.data
まず、hadoopが運転状態にあることを確認します.
synthetic_control.data
ファイルをhdfsにアップロードする.bin/hadoop fs -mkdir testdata
bin/hadoop fs -put /synthetic_control.data testdata
注意してください.hdfsフォルダ名をテストするためにはtestdataでなければなりません.入力と出力経路を変更する必要があります.inputと--outの二つのパラメータと必要ないくつかのパラメータがあります.bin/mahout org.apache.mahout.clustering.syntheticcontrol.canopy.Job
bin/mahout org.apache.mahout.clustering.syntheticcontrol.kmeans.Job
bin/mahout org.apache.mahout.clustering.syntheticcontrol.fuzzykmeans.Job
各コマンドはアルゴリズムテストを表します.hadoopを正常に動作させることができれば、jobを生成してインストール成功を証明します.