モジュール配置
5458 ワード
モジュールの配置
概要
Tachyonソースツリーでは、
In Tachyon source tree,
Tachyonに加えて、次のリストの下位ファイルシステムから異なる計算フレームワークを選択できます.計算フレーム Spark 下位ファイルシステム Hadoop1 Hadoop 2(ApacheとCDHを含む) GlusterFS AWS S3
後期の新しいフレームワークとファイルシステムが増加します.具体的には
前提条件
ダウンロード
デスクトップ版を展開したい場合はvirtualboxをダウンロードします.
python>=2.7をインストールし、python 3ではありません.
あなたのTachyon倉庫は
エラーが発生した場合は、pipを自分でインストールし、現在のディレクトリで実行します(sudoが必要かもしれません):
クイックハンドVirtualBox
ディレクトリ
はhadoop 2.4.1 2つのノードのTachyonクラスタを下位ファイルシステムとして作成する.
virtualboxミラーは後で使用するためにインストールおよび維持する必要があるため、初めて実行すると少し遅くなります.
クイックハンドAWS EC 2
オプション:AWS CLIを構成すると役に立つかもしれません.
AWSアカウント(Sign up)にログインしてEC 2にアクセスします.
shell環境変数
key pairをダウンロードします.ssh秘密鍵権限は必ず0600に変更してください.
キーペアとキーに名前を付けるPathのパーミッションキーパスはconf/ec 2に設定.yml .
aws vagrantプラグインのインストール(現在、version 0.5.0はテスト版):
デフォルトでは、Region(us-east-1)and Availability Zone(us-east-1 a)にtachyon-vagrant-testのSecurity Groupと名前を付ける必要はありません.Security Groupは、すべてのインバウンド/アウトバウンドネットワークトラフィックを一定範囲で自動的に設定します.何をしているか知っている場合は、conf/ec 2でセキュリティグループ、権限、および使用可能な領域を変更できます.ymlプロファイルにあります.それらのプロパティ値を構成する必要はありません.デフォルトでいいです.
Tachyonクラスタ集合hadoop 2.4.1下位ファイルシステムとしてus-east-1 a構成で実行されます.
AWS web consoleでインスタンスの実行状態を監視できます.
クラスタ構成
命令
Tachyon web UIのデフォルトポートは19999です.
Hadoop Web UIのデフォルトポートは:50070です.
これらのノード設定は、TachyonMaster TachyonWorker 1、TachyonWorker 2などと命名されます.
sshでノードにログインし、実行します.
sshでTachyonMasterにリンク:
TachyonMasterノードに入り、すべてのソフトウェアをrootディレクトリにインストールする必要があります.Tachyonは/tachyonに、Hadoopは/hadoopにインストールされます.
テストを再実行するTachyon:
テストがすべて合格した後、Tachyon Web UI:
提供されるツールスクリプトのTachyonMasterノード~/vagrant-utilsのディレクトリの下にあります.
実行:
TachyonMasterノードでは、指定されたを介してすべてのWorkerノードにファイルまたはディレクトリが配布されます.たとえば、TachyonMasterノードで構成を変更した後、このスクリプトを使用してすべてのWorkerノードに構成を更新します.
実行:
指定されたですべてのworkerノードでファイルまたはディレクトリを削除します.
実行:
すべてのノードで、現在のマウントポイントに再マウントします.
TachyonMasterノードでは、sshで任意のノードにログインしてパスワードを入力しないことができます.
本機
さっき作成したクラスタを破棄し、毎回1つのクラスタしか作成できません.コマンドが正常に実行されると、virtualbox仮想マシンはEC 2から削除され、インスタンスは終了します.
コンフィギュレーション
confの下には2つの異なるプロファイルがあります.There are two kinds of configuration files under virtualboxのvbのようなターゲット導入プラットフォームを構成する.yml,WAS EC 2のec 2.yml. ソフトウェア構成、tachyonに類似する.yml, spark.yml, ufs.yml(ufsは下位ファイルシステムと同等) すべてのプロファイルはyamlルール(yaml syntax.)を使用します.
構成の意味は、プロファイル内のプロファイルで詳細に説明されています.
AWS EC 2の新しいユーザーであれば、ec 2を理解することをお勧めします.ymlコメント説明.
FAQ
virtualbox仮想マシンのメモリサイズを増やすにはどうすればいいですか?
プロファイルconf/vbでymlはMachineMemory値を増やします.
Tachyon workerのメモリを増やすにはどうすればいいですか?
コンフィギュレーションconf/tachyon.ymlはWorkerメモリを追加します.
AWSでHDFS容量を拡張するにはどうすればいいですか?
ブロックデバイス関連付け(block device mapping)を明確にする.
conf/ec 2.yml Block_を参照Device_Mappingコメント説明.
どのようにAWSでEBSを使用しますか?
ブロックデバイス関連性の明確化(Specify block device mapping.)
conf/ec 2を参照してください.yml Block_についてDevice_Mappingのコメント説明.
どのようなEC 2インスタンスを使用すればいいですか?
あなたのニーズに最適なインスタンスタイプ(instance types)を選択してください.
EC 2の例は60 GBのSSDハードディスクが必要ですが、df-hはrootが10 GBしかないことを示しています.60 GBのSSDはどこへ行きましたか.
この拡張SSDディスクは、ブロックデバイス関連(block device mapping)で明確にしない限り使用されません.
conf/ec 2.yml Block_を参照Device_Mappingコメント説明.
rootデバイススペースを増やすにはどうすればいいですか?
まず、当然rootデバイスからより大きなEBSデータボリュームにデータを移行する、rootデバイスとして大きなデータボリュームを付加する、関連項目:how to expand ebs volume.
次に、ディスク全体を使用して新しいrootデバイスにパーティション化します.関連項目:how to expand partition.
PV/HVMとは?
公式サイトAWSドキュメントを参照してください.(Please refer to official AWS documentation.)
概要
Tachyonソースツリーでは、
deploy/vagrant
ディレクトリには、AWS EC 2またはvirtualboxでTachyonクラスタを構築するのに役立つツールが含まれています.In Tachyon source tree,
deploy/vagrant
directory contains utilities to help you set up a Tachyon cluster on AWS EC2 or virtualbox. Tachyonに加えて、次のリストの下位ファイルシステムから異なる計算フレームワークを選択できます.
後期の新しいフレームワークとファイルシステムが増加します.具体的には
deploy/vagrant/README.md
で拡張部分を見てください.貢献を歓迎します.前提条件
ダウンロード
デスクトップ版を展開したい場合はvirtualboxをダウンロードします.
python>=2.7をインストールし、python 3ではありません.
あなたのTachyon倉庫は
deploy/vagrant
ディレクトリの下にあり、次のようにPathyon依存ライブラリをインストールします.sudo bash bin/install.sh
エラーが発生した場合は、pipを自分でインストールし、現在のディレクトリで実行します(sudoが必要かもしれません):
pip install -r pip-req.txt
クイックハンドVirtualBox
ディレクトリ
deploy/vagrant
に切り替えて実行:./create 2 vb
はhadoop 2.4.1 2つのノードのTachyonクラスタを下位ファイルシステムとして作成する.
virtualboxミラーは後で使用するためにインストールおよび維持する必要があるため、初めて実行すると少し遅くなります.
クイックハンドAWS EC 2
オプション:AWS CLIを構成すると役に立つかもしれません.
AWSアカウント(Sign up)にログインしてEC 2にアクセスします.
shell環境変数
AWS_ACCESS_KEY_ID
およびAWS_SECRET_ACCESS_KEY
を設定し、this docを参照して詳細を参照してください.key pairをダウンロードします.ssh秘密鍵権限は必ず0600に変更してください.
キーペアとキーに名前を付けるPathのパーミッションキーパスはconf/ec 2に設定.yml .
aws vagrantプラグインのインストール(現在、version 0.5.0はテスト版):
vagrant plugin install vagrant-aws
vagrant box add dummy https://github.com/mitchellh/vagrant-aws/raw/master/dummy.box
デフォルトでは、Region(us-east-1)and Availability Zone(us-east-1 a)にtachyon-vagrant-testのSecurity Groupと名前を付ける必要はありません.Security Groupは、すべてのインバウンド/アウトバウンドネットワークトラフィックを一定範囲で自動的に設定します.何をしているか知っている場合は、conf/ec 2でセキュリティグループ、権限、および使用可能な領域を変更できます.ymlプロファイルにあります.それらのプロパティ値を構成する必要はありません.デフォルトでいいです.
Tachyonクラスタ集合hadoop 2.4.1下位ファイルシステムとしてus-east-1 a構成で実行されます.
./create <number of machines> aws
AWS web consoleでインスタンスの実行状態を監視できます.
クラスタ構成
命令
./create <number of machines> aws
の実行が成功すると、Shellは次の2つの紫色の内容を出力する.>>> TachyonMaster public IP is xxx <<<
>>> visit default port of the web UI of what you deployed <<<
Tachyon web UIのデフォルトポートは19999です.
Hadoop Web UIのデフォルトポートは:50070です.
http://{MASTER_IP}:{PORT}
ブラウザにアクセスすると、Web UIが表示されます.これらのノード設定は、TachyonMaster TachyonWorker 1、TachyonWorker 2などと命名されます.
sshでノードにログインし、実行します.
vagrant ssh {NODE_NAME}
sshでTachyonMasterにリンク:
vagrant ssh TachyonMaster
TachyonMasterノードに入り、すべてのソフトウェアをrootディレクトリにインストールする必要があります.Tachyonは/tachyonに、Hadoopは/hadoopにインストールされます.
テストを再実行するTachyon:
/tachyon/bin/tachyon runTests
テストがすべて合格した後、Tachyon Web UI:
http://{MASTER_IP}:19999
に再びアクセスし、ナビゲーションバーでファイルシステムを閲覧すると、Tachyonに書き込まれたテストが表示されるはずです.提供されるツールスクリプトのTachyonMasterノード~/vagrant-utilsのディレクトリの下にあります.
実行:
~/vagrant-utils/copy-dir <path>
TachyonMasterノードでは、指定された
実行:
~/vagrant-utils/copy-dir --delete <path>
指定された
実行:
~/vagrant-utils/remount <source directory> <destination directory>
すべてのノードで、現在のマウントポイント
<source directory>
からデバイスをアンインストールして、別のマウントポイントTachyonMasterノードでは、sshで任意のノードにログインしてパスワードを入力しないことができます.
ssh TachyonWorker1
本機
deploy/vagrant
ディレクトリの下で、実行します../destroy
さっき作成したクラスタを破棄し、毎回1つのクラスタしか作成できません.コマンドが正常に実行されると、virtualbox仮想マシンはEC 2から削除され、インスタンスは終了します.
コンフィギュレーション
confの下には2つの異なるプロファイルがあります.There are two kinds of configuration files under
conf
:構成の意味は、プロファイル内のプロファイルで詳細に説明されています.
AWS EC 2の新しいユーザーであれば、ec 2を理解することをお勧めします.ymlコメント説明.
FAQ
virtualbox仮想マシンのメモリサイズを増やすにはどうすればいいですか?
プロファイルconf/vbでymlはMachineMemory値を増やします.
Tachyon workerのメモリを増やすにはどうすればいいですか?
コンフィギュレーションconf/tachyon.ymlはWorkerメモリを追加します.
AWSでHDFS容量を拡張するにはどうすればいいですか?
ブロックデバイス関連付け(block device mapping)を明確にする.
conf/ec 2.yml Block_を参照Device_Mappingコメント説明.
どのようにAWSでEBSを使用しますか?
ブロックデバイス関連性の明確化(Specify block device mapping.)
conf/ec 2を参照してください.yml Block_についてDevice_Mappingのコメント説明.
どのようなEC 2インスタンスを使用すればいいですか?
あなたのニーズに最適なインスタンスタイプ(instance types)を選択してください.
EC 2の例は60 GBのSSDハードディスクが必要ですが、df-hはrootが10 GBしかないことを示しています.60 GBのSSDはどこへ行きましたか.
この拡張SSDディスクは、ブロックデバイス関連(block device mapping)で明確にしない限り使用されません.
conf/ec 2.yml Block_を参照Device_Mappingコメント説明.
rootデバイススペースを増やすにはどうすればいいですか?
まず、当然rootデバイスからより大きなEBSデータボリュームにデータを移行する、rootデバイスとして大きなデータボリュームを付加する、関連項目:how to expand ebs volume.
次に、ディスク全体を使用して新しいrootデバイスにパーティション化します.関連項目:how to expand partition.
PV/HVMとは?
公式サイトAWSドキュメントを参照してください.(Please refer to official AWS documentation.)