kettle spoon接続hbase


spoonダウンロードのインストール先:http://www.pentaho.com/download
選択  Download Windowsはwindows版だけがspoonです.ダウンロードして解凍したら使えます.インストールする必要がありません.
spoonは純javaで作成されていますので、使用前にjavaのjdkパッケージをインストールしなければなりません.
ダウンロード先:http://www.oracle.com/technetwork/java/javase/downloads/index.html
HBaseを接続するには配置が必要です(実際にHBaseを接続するには、zookeeperサービスを通じて)
spoon解凍カタログに入り、plugins\pentah-big-data-plugn\plugin.propertiesファイルを開きます.
kettle spoon连接hbase_第1张图片
変更  active.hadoop.1 nfigrationの設定項目(ドライバのカタログ名を設定)は、ここでは空です.現在修正されました.
目次のplugins\pentah-big-data-plugn\hadoop-configrationsに入って、現在利用可能なドライバのカタログを調べます.
kettle spoon连接hbase_第2张图片
中の4つのディレクトリはすべてhadoop-configrationsのドライバ集で、HBaseをリンクするにはzookeeper-*.jarファイルが必要です.
cdh 52ディレクトリlibの下にあるように:
kettle spoon连接hbase_第3张图片
それなら、cdh 52はドライバセットで使えます.
HBase起動時はサーバーのhostname値をバインドしますので、spoonマシンでは同じhostをバインドしないと接続できません.
HBaseマシンにコマンドを入力します.
hostname
例えば:
root@ubuntu:~# hostname
ubuntu
そしてspoonマシンのhostsを修正します.
C:\Windows\System 32\drivers\etc\hostsファイルを開きます.
HBaseサーバのIPは192.168.0.10です.
hostsファイルに行を追加して保存します.
192.168.0.10 ubuntu
spoonを開いて、spoon解圧目次に入ってSpoon.batファイルをダブルクリックします.
注:実はlinuxでも実行できます.spoon.shスクリプトを開けばいいです.
新しい変換を行い、Big Data>HBase Inputをクリックします.
kettle spoon连接hbase_第4张图片
HBase Inputアイコンをダブルクリックします.  NewポップアップをクリックしてHadoop clusterウィンドウを編集します.
kettle spoon连接hbase_第5张图片
Custer Name値を修正します.(つまり、このHBase接続の別名です.)Zoo KeeperはHBaseのサーバーIPが192.168.0.10で、デフォルトのHBaseポート番号は2182です.
kettle spoon连接hbase_第6张图片
確定して、そしてHadoop Clausterでhbase-testを選択します.
kettle spoon连接hbase_第7张图片
Create/Edit mappings選択カードに入り、以下の手順で操作します.
kettle spoon连接hbase_第8张图片
その後、Configure queryタブに戻り、手順に従います.
kettle spoon连接hbase_第9张图片
次に、マウスの右ボタンHBase Inputをクリックして、Previewを選択します.  > クイックスタート
データが表示されます.