CentOS hadoop分散クラスタの構築

2009 ワード

擬似分布式から分布式まで、2つのプロファイル(slaves、masters)しか差がないこと.
クラスタ内のすべてのノードは、互いにパスワードなしでログイン(An−1 n対の関係)が実現され、ノードはhadoop(各ノードの擬似分布式が構築され、擬似分布式の構築はCentOS hadoop擬似分布式インストール手順を参照)とjdk、および環境変数の設定が構成されている.環境設定が完了すると、クラスタの構築と導入が開始されます.

(1)マスタースレーブノードの決定、すなわち分散クラスタ構造の決定(実際の動作に実行されるのは、実はマスターノードのプロファイル/conf/...)

(2)プライマリノードのhadoopのプロファイル、すなわち/conf/slavesファイル(スレーブノードの設定)を変更し、secondarynamenodeを他のノードに設定したい場合は、/conf/masters設定(secondarynamenodeに設定するホストのホスト名をmastersファイルに追加)します.

(3)この時点で分散構造が構築済みであり、フォーマット(初期化)が可能となり、

が起動する.

hadoop namenode -format
start-all.sh #              #   start-all.sh   ， #             `/hadoop/bin/` ，    `start-all.sh`

出力情報に基づいてhadoopクラスタの起動順序を知ることができます.

(1)hadoop 0などのプライマリノードで起動し、namenodeし、/usr/local/hadoop 0/logs/に関連ログ情報を記入する.最終的にhadoopはそのルートディレクトリの下にlogsフォルダ(ない場合)を作成し、hadoop-root-jobtracker-hadoop 0というプロファイルに新規作成して起動情報(成功するかどうか)を記入する.log hadoop-root-jobtracker-hadoop0.out hadoop-root-namenode-hadoop0.out hadoop-root-namenode-hadoop0.log hadoop-root-secondarynamenode-hadoop0.log hadoop-root-secondarynamenode-hadoop0.out

(2)各スレーブノード(例えばhadoop 1、hadoop 2)においてそれぞれのdatanodeが前後して起動する、自然スレーブノードの下のログ情報は両面(datanode、TaskTracker):hadoop-root-datanode-hadoop 1についてである.log hadoop-root-datanode-hadoop1.out hadoop-root-tasktracker-hadoop1.log hadoop-root-tasktracker-hadoop1.out

(3)メインノードでsecondarynamenode,JobTracker

を起動

(4)各スレーブノードにおいてそれぞれTaskTracker

が前後して起動する.
stop-allを使用します.shクローズの順序は主に:
stopping jobtracker(hadoop 0,メインノード)hadoop 1:stopping tasktracker hadoop 2:stopping tasktracker stopping namenode(hadoop 0,メインノード)hadoop 2:stopping datanode hadoop 1:stopping datanode localhost:stopping secondarynamenode(hadoop 0,メインノード)

タイムセレクタツールクラス

クラスタがhadoopを起動すると、クライアントはWeb UIを開くことができません.