hadoopにsnappyを取り付けます.
snappyも開源の高効率圧縮と解凍フレームである.具体的な紹介はここではもう詳しく説明しません.公式サイトで調べられます.
インストールに必要なソフトウェア:gcc、g+、snappyパッケージ、hadoop-snappyソースパッケージ、maven.
gccはuuntuにインストールされていますが、もしインストールされていないなら、g++,mavenを含めて、以下のコマンドでインストールできます.
snappy:http://code.google.com/p/snappy/downloads/list
次のコマンドを実行します
ダウンロード先:http://hadoop-snappy.googlecode.com/svn/trunk/
hadoop-snappyをコンパイルするにはatomakeとlibtoolパッケージが必要です.次のコマンドを実行します.
インストールに必要なソフトウェア:gcc、g+、snappyパッケージ、hadoop-snappyソースパッケージ、maven.
gccはuuntuにインストールされていますが、もしインストールされていないなら、g++,mavenを含めて、以下のコマンドでインストールできます.
- sudo apt-get install gcc g++ maven2
ダウンロードパッケージ:snappy:http://code.google.com/p/snappy/downloads/list
次のコマンドを実行します
- tar -zxvf snappy-1.0.5.tar.gz
- cd snappy-1.0.5
- ./configure
- make
- sudo make install
SVNクライアントを使用してhadoop-snappyソースをダウンロードします.ダウンロード先:http://hadoop-snappy.googlecode.com/svn/trunk/
hadoop-snappyをコンパイルするにはatomakeとlibtoolパッケージが必要です.次のコマンドを実行します.
- sudo apt-get install automake libtool
- cd hadoop-snappy
- mvn package
そしてコンパイルした後の hadoop-snappy-1.05-tar/hadoop-snappy-1.05/lib/下のjarバッグをHADOOPにコピーします.HOME/libで、プロファイルcore-site.xmlを修正します.
- <property>
- <name>mapred.compress.map.output</name>
- <value>true</value>
- </property>
- <property>
- <name>mapred.map.output.compression.codec</name>
- <value>org.apache.hadoop.io.compress.SnappyCodec</value>
- </property>
- <property>
- <name>io.compression.codecs</name>
- <value>org.apache.hadoop.io.compress.GzipCodec,
- org.apache.hadoop.io.compress.DefaultCodec,
- org.apache.hadoop.io.compress.BZip2Codec,
- com.hadoop.compression.lzo.LzoCodec,
- com.hadoop.compression.lzo.LzopCodec,
- org.apache.hadoop.io.compress.SnappyCodec
- </value>
- </property>
- <property>
- <name>io.compression.codec.lzo.class</name>
- <value>com.hadoop.compression.lzo.LzoCodec</value>
- </property>
その後、ハdoopを再起動して完了します.