簡単至上、hadoop開発環境を構築


hadoopは純粋なjavaで書かれており、プラットフォームとは関係ありませんが、公式にはshellの起動スクリプトしか与えられていないので、linuxでは開発環境として単機hadoopを実行しやすいです
もし空きマシンがlinuxを走ることがなければ、windowsの下で、1つの仮想マシンをインストールしてlinuxを開く以外に、更に簡単な方法があって、windowsの下でhadoopを起動します
cygwinはwindowsの下でshellスクリプトを実行する良いもので、スクリプト自体のほか、linuxの下でgrep、sshなどのよく使われるツールもあります.インストール時にデフォルトでsshを1つ多く選択する必要があります.hadoopの実行にはこのコマンドが必要です.
cygwinをインストールして、sshdを構成して起動して、それから、cygwinのあの破れたインターフェースを使わないでください、scrtの類のツールsshでlocalhostに着いて、cygwinのコンソールはすべてコピーして貼り付けることができません.
shell環境があれば、hadoopを簡単に設定し、最も簡単な単機で実行します.デフォルトで解凍されたhadoop/conf/hadoop-site/xmlに3つの属性を加えるだけです.

<property>
	<name>fs.default.name</name>
	<value>hdfs://localhost:9100</value>
</property>
<property>
	<name>mapred.job.tracker</name>
	<value>localhost:9101</value>
</property>
<property>
	<name>dfs.replication</name>
	<value>1</value>
</property>

もう一つJAVA_HOMEこの環境変数を変更するには、cygwin環境がアクセスできるパスに変更します.すなわち、D:jdkを/cygdrivers/d/jdkに変更します.
あなたのシステム環境変数で変更する必要はありません.hadoop/conf/hadoop-env.shで指定すればいいです.
そして
hadoop/bin/hadoop namenode-formatフォーマットdfs
hadoop/bin/start-all.shサービス開始、ok