hadoopノード管理

3009 ワード

(hadoopバージョン1.0.3)
hadoopノード追加操作
OS環境が正常にインストールされたことを前提として、次の手順に従います.
第一:マスター本体にある$HADOOP_HOME/confでslavesファイルを修正し、ノードホスト名を追加
第二:ログイン免除設定の設定
第三に、新しいノードはdatanodeとtasktrackerの2つのプロセスを開始します.
          $HADOOP_HOME/bin/hadoop-daemon.sh start datanode
         $HADOOP_HOME/bin/hadoop-daemon.sh start tasktracker
第四:masterはすべてのノードをリフレッシュする
         $HADOOP_HOME/bin/hadoop dfsadmin -refreshNodes

データへいこうさぎょう

[hadoop@master hadoop-1.0.3]# ./bin/start-balancer.sh

1)balanceを使用しない場合、clusterは新しいデータを新しいnodeに格納します.これによりmapredの生産性が低下します.2)バランスしきい値を設定します.デフォルトは10%です.値が低いほど各ノードはバランスしますが、消費時間も長くなります.

[hadoop@master hadoop-1.0.3]# ./bin/start-balancer.sh -threshold 5
hadoop balancer -Threshold 20

パラメータ20は、比例パラメータであり、20%を表している.つまり、各DataNodeの直接ディスク使用率のばらつきが20%以内である.
3)balanceの帯域幅を設定し、デフォルトは1 M/sのみ

 <property>
 　　<name>dfs.balance.bandwidthPerSec</name>
 　　<value>1048576</value>
 　　<description>
 　　　　Specifies the maximum amount of bandwidth that each datanode
 　　　　can utilize for the balancing purpose in term of
 　　　　the number of bytes per second.
 　　</description>
 </property>

注意:1.slaveのfirewallが閉じていることを確認する必要があります.2.新しいslaveのipがmasterおよび他のslavesの/etc/hostsに追加されていることを確認し、逆にmasterおよび他のslaveのipを新しいslaveの/etc/hostsに追加する

関連ノードの削除アクション
1.クラスタ構成conf/hdfs-site.xmlファイルの変更(ノード構成格納パスを除外する必要がある)

 <property>
 　　<name>dfs.hosts.exclude</name>
 　　<value>/home/hadoop/hadoop/conf/excludes</value>
 　　<description>Names a file that contains a list of hosts that are
 　　not permitted to connect to the namenode.  The full pathname of the
 　　file must be specified.  If the value is empty, no hosts are
 　　excluded.</description>
 </property>

2.フレームを降ろすマシンdfs.hosts.excludeが定義したファイルの内容は、オフラインが必要なマシンごとに1行1つです.これは彼らがNamenodeに接続することを阻止します.次のようになります.

slave10
slave11

3.強制再ロード構成

[hadoop@master hadoop-1.0.3]# ./bin/hadoop dfsadmin  -refreshNodes

バックグラウンドでBlockブロックの移動を行います
4.ノードを閉じる先ほどの操作が完了するまで待って、架け降ろしが必要な機器は安全に閉じることができます.

[hadoop@master hadoop-1.0.3]# ./bin/ hadoop dfsadmin -report

現在のクラスタに接続されているノードを表示できます

    Decommission，   ：
Decommission Status : Decommission in progress  

     ，   ：
Decommission Status : Decommissioned

5.再度excludesファイルを編集一旦マシンのダウンフレームが完了すると、それらはexcludesファイルからログインしてダウンフレームするマシンを削除することができ、DataNodeプロセスがなくなったことを発見するが、TaskTrackerは依然として存在し、手作業で処理する必要がある

注意:
データ等化操作を少なくする.ここで体験したように,クラスタノードは多くなく,データ総量は2 TB以上で,バランスが非常に長い(開始時間:13:44:12カットオフ時間:16:56:37).
ノードを削除する操作は少なく、ノードのデータ移行処理にも関わるため、非常に時間がかかります.

使用中は、この2つの操作に注意してください.本当にビジネスニーズがない限り、これらの操作はできるだけ避けます.

JAva,BufferedReader入力

jqueryクッキープラグイン