HDP 3.1 + HDF 3.1 あるいはHDF 3.3をAmbari blueprint とAWS AMIでデプロイ


概要:

参考記事
https://community.hortonworks.com/articles/218863/automate-deployment-of-hdp30hdf32-or-hdf32-standal.html

HDF 3.3のリリースで沢山の改善点がありました。
Ambari-bootstrapを使えば、Blueprintで簡単にHDFもしくはHDF+HDPのクラスタを簡単に立ち上げることが出来ます。
Ambari-bootstrap:
https://github.com/seanorama/ambari-bootstrap
AWSのAMIは既に用意してあるので、自動化もしやすいです。

Steps for each of the below option are described in this article:

  • A. Single-node prebuilt AMIs on AWS
  • B. Single-node fresh installs
  • C. Multi-node fresh installs

A. Single-node prebuilt AMI on AWS:

Steps to launch the AMI

1. AWS console pageにログインする。

2. ‘N. California’リジョンから、下記AMIを選択

instance type 選んで、次へ:
‘m4.2xlarge’


※節約のためにもっと小さいインスタンスを選んだら、一部起動出来ないサービスがあるかも

設定:デフォルト設定のままで、次へ

Storage選択:800GB以上の容量を入れてください

  1. 好きのように、タグを設定

  2. セキュリティグループ設定

設定を再確認:

該当EC2インスタンスをSSHでログインするために、Key Pareを選択/新規作成:

Your instances are now launching’の下にある、EC2インスタンスのリンクをクリックして、詳細を見る:

上記操作で、EC2インスタンスの詳細ページが表示される:

ここでPublic IPが見れる

数分後(5−10分)、上記IPにアクセスしてみてください。
URL:
http://:8080

  • アカウント:admin
  • パスワード:StrongPassword

これでサービスの状況見れる

SSHで、EC2にログインすることも出来ます。

ssh -i ~/.ssh/mykey.pem centos@<publicIP>
tail -f /var/log/hdp_startup.log


↑、Ambari画面

B. Single-node install:

  • HDF 3.3 only cluster
    export host_count=1
    curl -sSL https://gist.github.com/abajwa-hw/b5565d7e7f9beffd8dd57a970dc54266/raw | sudo -E sh
  • HDF 3.3/HDP3.1 combined cluster
    export host_count=1
    curl -sSL https://gist.github.com/abajwa-hw/d7cd1c0232c1af46ee2c465e4871ddc6/raw | sudo -E sh

C. Multi-node HDF 3.3 install:

省略