kettle spoon接続hbase
spoonダウンロードのインストール先:http://www.pentaho.com/download
選択 Download Windowsはwindows版だけがspoonです.ダウンロードして解凍したら使えます.インストールする必要がありません.
spoonは純javaで作成されていますので、使用前にjavaのjdkパッケージをインストールしなければなりません.
ダウンロード先:http://www.oracle.com/technetwork/java/javase/downloads/index.html
HBaseを接続するには配置が必要です(実際にHBaseを接続するには、zookeeperサービスを通じて)
spoon解凍カタログに入り、plugins\pentah-big-data-plugn\plugin.propertiesファイルを開きます.
変更 active.hadoop.1 nfigrationの設定項目(ドライバのカタログ名を設定)は、ここでは空です.現在修正されました.
目次のplugins\pentah-big-data-plugn\hadoop-configrationsに入って、現在利用可能なドライバのカタログを調べます.
中の4つのディレクトリはすべてhadoop-configrationsのドライバ集で、HBaseをリンクするにはzookeeper-*.jarファイルが必要です.
cdh 52ディレクトリlibの下にあるように:
それなら、cdh 52はドライバセットで使えます.
HBase起動時はサーバーのhostname値をバインドしますので、spoonマシンでは同じhostをバインドしないと接続できません.
HBaseマシンにコマンドを入力します.
C:\Windows\System 32\drivers\etc\hostsファイルを開きます.
HBaseサーバのIPは192.168.0.10です.
hostsファイルに行を追加して保存します.
注:実はlinuxでも実行できます.spoon.shスクリプトを開けばいいです.
新しい変換を行い、Big Data>HBase Inputをクリックします.
HBase Inputアイコンをダブルクリックします. NewポップアップをクリックしてHadoop clusterウィンドウを編集します.
Custer Name値を修正します.(つまり、このHBase接続の別名です.)Zoo KeeperはHBaseのサーバーIPが192.168.0.10で、デフォルトのHBaseポート番号は2182です.
確定して、そしてHadoop Clausterでhbase-testを選択します.
Create/Edit mappings選択カードに入り、以下の手順で操作します.
その後、Configure queryタブに戻り、手順に従います.
次に、マウスの右ボタンHBase Inputをクリックして、Previewを選択します. > クイックスタート
データが表示されます.
選択 Download Windowsはwindows版だけがspoonです.ダウンロードして解凍したら使えます.インストールする必要がありません.
spoonは純javaで作成されていますので、使用前にjavaのjdkパッケージをインストールしなければなりません.
ダウンロード先:http://www.oracle.com/technetwork/java/javase/downloads/index.html
HBaseを接続するには配置が必要です(実際にHBaseを接続するには、zookeeperサービスを通じて)
spoon解凍カタログに入り、plugins\pentah-big-data-plugn\plugin.propertiesファイルを開きます.
変更 active.hadoop.1 nfigrationの設定項目(ドライバのカタログ名を設定)は、ここでは空です.現在修正されました.
目次のplugins\pentah-big-data-plugn\hadoop-configrationsに入って、現在利用可能なドライバのカタログを調べます.
中の4つのディレクトリはすべてhadoop-configrationsのドライバ集で、HBaseをリンクするにはzookeeper-*.jarファイルが必要です.
cdh 52ディレクトリlibの下にあるように:
それなら、cdh 52はドライバセットで使えます.
HBase起動時はサーバーのhostname値をバインドしますので、spoonマシンでは同じhostをバインドしないと接続できません.
HBaseマシンにコマンドを入力します.
hostname
例えば:root@ubuntu:~# hostname
ubuntu
そしてspoonマシンのhostsを修正します.C:\Windows\System 32\drivers\etc\hostsファイルを開きます.
HBaseサーバのIPは192.168.0.10です.
hostsファイルに行を追加して保存します.
192.168.0.10 ubuntu
spoonを開いて、spoon解圧目次に入ってSpoon.batファイルをダブルクリックします.注:実はlinuxでも実行できます.spoon.shスクリプトを開けばいいです.
新しい変換を行い、Big Data>HBase Inputをクリックします.
HBase Inputアイコンをダブルクリックします. NewポップアップをクリックしてHadoop clusterウィンドウを編集します.
Custer Name値を修正します.(つまり、このHBase接続の別名です.)Zoo KeeperはHBaseのサーバーIPが192.168.0.10で、デフォルトのHBaseポート番号は2182です.
確定して、そしてHadoop Clausterでhbase-testを選択します.
Create/Edit mappings選択カードに入り、以下の手順で操作します.
その後、Configure queryタブに戻り、手順に従います.
次に、マウスの右ボタンHBase Inputをクリックして、Previewを選択します. > クイックスタート
データが表示されます.