flumeの原理と運行メカニズム
1197 ワード
一、flumeの概要:
⑴Flumeのメリット Flumeは、HDFS、HBAse など、アプリケーションによって生成されたデータを任意の集中メモリに格納することができる.データを収集する速度が書き込みデータを超える場合、つまり収集情報がピークに達した場合、収集情報は非常に大きく、システムの書き込みデータ能力を超える場合、Flumeはデータ生産者とデータ収容器との間で調整を行い、両者の間で共通の安定したデータを提供することを保証する. は、コンテキストルーティング特徴 を提供する. Flumeのパイプラインはトランザクションに基づいており、データの転送と受信時の一貫性が保証されている. Flumeは信頼性が高く、フォールトトレランスが高く、アップグレード可能で、管理しやすく、カスタマイズ可能です.
(2)Flumeが持つ特徴: Flumeは、複数のウェブサイトサーバで収集するログ情報をHDFS/HBAseの に効率よく格納することができる. Flumeを使用すると、複数のサーバから取得したデータをHadoopの に迅速に移行できます.ログ情報のほか、Flumeはフェイスブック、twitter、アマゾン、flipkartなどの などの大規模なソーシャルネットワークノードのイベントデータを収集するためにも使用できます.は、様々なアクセスリソースデータのタイプおよび受信データのタイプ をサポートする.はマルチパス流量、マルチパイプアクセス流量、マルチパイプ接続流量、コンテキストルーティングなどの をサポートする.は、水平に拡張することができる .
二、アーキテクチャ
Flumeのアーキテクチャには主にいくつかのコア概念があります.
Event(イベント):flumeがデータを転送する基本単位であり、テキストファイルの場合、通常は1行のレコードであり、これもトランザクションの基本単位である.1つの転載データのバイト配列+1つのオプションヘッダから構成される.EventはSourceからChannelに流れ、Sinkに向かいます.典型的なFlumeイベントは、次のように構成されています.
flume 、 、 、 。 , ; ,Flume , ( 、HDFS、Hbase ) ;
Flume java , Java1.6
⑴Flumeのメリット
(2)Flumeが持つ特徴:
二、アーキテクチャ
Flumeのアーキテクチャには主にいくつかのコア概念があります.
Event(イベント):flumeがデータを転送する基本単位であり、テキストファイルの場合、通常は1行のレコードであり、これもトランザクションの基本単位である.1つの転載データのバイト配列+1つのオプションヘッダから構成される.EventはSourceからChannelに流れ、Sinkに向かいます.典型的なFlumeイベントは、次のように構成されています.