WSL上のハイブのインストール


ハイブのインストールと実行


Apache Hiveのインストール
Apache Hiveを設定するには、まずハイブをダウンロードして解凍する必要があります.次に、次のファイルと設定をカスタマイズする必要があります.
ubuntuコマンドラインと圧縮されたhiveファイルをダウンロードし、wgetコマンドをダウンロードパスに従ってダウンロードします.
wget https://downloads.apache.org/hive/hive-3.1.2/apache-hive-3.1.2-bin.tar.gz

ダウンロードプロセスが完了すると、圧縮されたHiveパッケージをuntarします.
tar xzf apache-hive-3.1.2-bin.tar.gz

ステップ2


Hive環境変数を設定する
$ HiveCountホーム環境変数は、APIシェル- 3.1.2 - binディレクトリにクライアントシェルを指示する必要があります.エディット.BASHRCシェル設定ファイルを選択したテキストエディタを使用します(ナノを使用します).
source vim ~/.bashrc
次のハイブ環境変数を追加します.bashrcファイル:
export HIVE_HOME= "home/anuj/hadoop/apache-hive-3.1.2-bin"
export PATH=$PATH:$HIVE_HOME/bin

保存して終了します.BASHRCファイルを一度ハイブ変数を追加します.現在の環境に変更を次のコマンドで適用します.
source ~/.bashrc

ステップ3


Hiveの設定を編集します.SHファイル
Apache HiveはHadoop分散ファイルシステムと対話できるようにする必要があります.アクセスハイブの設定.事前に作成された$ hiveRANUS変数を使ったshファイル
sudo vim $HIVE_HOME/bin/hive-config.sh

SET - 4


ディレクトリを作成する
  • 一時的なTMPディレクトリは、ハイブプロセスの中間結果を保存するつもりです.
  • 倉庫ディレクトリは、ハイブ関連のテーブルを格納する予定です.
    ディレクトリを作成する
    HDFSストレージ層内にTMPディレクトリを作成します.このディレクトリは、中間データハイブをHDFSに送信します.
  • hdfs dfs -mkdir /tmp
    
    TMPグループメンバーに書き込み権限と実行許可を追加する
    hdfs dfs -chmod g+w /tmp
    
    パーミッションが正しく追加されているかどうかを調べます.
    hdfs dfs -ls /
    
    出力は、ユーザーが今書き込みと実行許可を持っていることを確認します.
    コマンドをHadoop fs - ls/に入力します.

    ディレクトリの作成
    /user/hive/parentディレクトリ内の倉庫ディレクトリを作成します.
    hdfs dfs -mkdir -p /user/hive/warehouse
    
    Writerグループのメンバーに書き込み許可と実行許可を追加する
    hdfs dfs -chmod g+w /user/hive/warehouse
    
    パーミッションが正しく追加されているかどうかを調べます.
    hdfs dfs -ls /user/hive
    
    出力は、ユーザーが今書き込みと実行許可を持っていることを確認します.

    SET - 5


    ハイブのサイトを設定します.xmlファイル(オプション)
    Apache Hiveディストリビューションはデフォルトでテンプレート設定ファイルを含んでいます.テンプレートファイルはhive confディレクトリ内にあり、デフォルトのハイブ設定をアウトラインします.
    以下のコマンドを使って正しいファイルを探します.
    cd $HIVE_HOME/conf
    
    lsコマンドを使用してフォルダに含まれるファイルを一覧表示します.

    Hiveのデフォルトを使用します.XMLHiveサイトを作成するテンプレート.XMLファイル:
    cp hive-default.xml.template hive-site.xml
    
    アクセスハイブサイト.ナノテキストエディタを用いたXMLファイル
    sudo vim hive-site.xml
    

    ステップ6


    Apache Hiveは、Derbyデータベースを使用してメタデータを格納します.Schematoolコマンドを使用して、hibin binディレクトリからダービーデータベースを開始します.
    $HIVE_HOME/bin/schematool -dbType derby -initSchema
    
    プロセスは完了するために数回かかることができます.

    ダービーは、ハイブのデフォルトのメタデータストアです.MySQLやPostgreSQLなどの異なるデータベースソリューションを使用する場合は、Hiveサイトでデータベースタイプを指定できます.XMLファイル.
    のUbuntuクライアントシェルを起動する
    次のコマンドを使用して、ハイブコマンドラインインターフェイスを起動します.
    cd $HIVE_HOME/bin
    
    hive
    
    現在、SQLのようなコマンドを発行し、直接HDFSと対話することができます.