appche mahoust 0.8インストールとテスト

1060 ワード

tar.gzのインストールパッケージをダウンロードします.
住所:http://www.apache.org/dyn/closer.cgi/mahout/
ダウンロードして解凍します.インストールしたいパスにあります.
binディレクトリ下のmahotファイルを修正します.
ファイルの先頭に変数を追加します.
HADOOP_HOME=hadoop     
HADOOP_CONF_DIR=hadoop     
ローカルのデータファイルを呼び出したいなら、hadoopを使わないとMAHOUT_を追加する必要があります.LOCALの変数
テスト用のデータファイルをダウンロードします.http://archive.ics.uci.edu/ml/databases/synthetic_control/synthetic_control.data
まず、hadoopが運転状態にあることを確認します.synthetic_control.dataファイルをhdfsにアップロードする.
bin/hadoop fs -mkdir testdata
bin/hadoop fs -put        /synthetic_control.data testdata
注意してください.hdfsフォルダ名をテストするためにはtestdataでなければなりません.入力と出力経路を変更する必要があります.inputと--outの二つのパラメータと必要ないくつかのパラメータがあります.
bin/mahout org.apache.mahout.clustering.syntheticcontrol.canopy.Job
bin/mahout org.apache.mahout.clustering.syntheticcontrol.kmeans.Job
bin/mahout org.apache.mahout.clustering.syntheticcontrol.fuzzykmeans.Job
各コマンドはアルゴリズムテストを表します.
hadoopを正常に動作させることができれば、jobを生成してインストール成功を証明します.