オンラインマシンの異なる構造による構成の問題
2254 ワード
ライン上にはscribeをテストする16台のクラスタがあり、配置が終わった後、benchmarkを走って、問題ありません.しかし、しばらく走った後、多くのjobがpendingに住んでいることに気づき、新聞の間違いは:
Googleで検索したところ、ディスク容量の不足によるものと判明しました.
df-h後に/下のディスクがいっぱいになっていることに気づき、誰が/ディレクトリの下のディスクを占有しているのか分からなかった.
后で同僚の注意のもとでやっと発见して、このいくつかの机械は异なって构造して、10台ぐらいは12のハードディスクを挂けて、6台は10のハードディスクだけを挂けて、だからシナリオで构筑する时すべて12のハードディスクによって书く日志を筑いて、/data 10/data 11の下で书いて、/だからすぐに/ディレクトリは书き込まれていっぱいになりました.
新しい構成から再起動して問題を解決します.
Error initializing attempt_201204030722_0004_m_000002_0:
ENOENT: No such file or directory
at org.apache.hadoop.io.nativeio.NativeIO.chmod(Native Method)
at org.apache.hadoop.fs.FileUtil.execSetPermission(FileUtil.java:692)
at org.apache.hadoop.fs.FileUtil.setPermission(FileUtil.java:647)
at org.apache.hadoop.fs.RawLocalFileSystem.setPermission(RawLocalFileSystem.java:509)
at org.apache.hadoop.fs.RawLocalFileSystem.mkdirs(RawLocalFileSystem.java:344)
at org.apache.hadoop.mapred.JobLocalizer.initializeJobLogDir(JobLocalizer.java:239)
at org.apache.hadoop.mapred.DefaultTaskController.initializeJob(DefaultTaskController.java:196)
at org.apache.hadoop.mapred.TaskTracker$4.run(TaskTracker.java:1226)
at java.security.AccessController.doPrivileged(Native Method)
at javax.security.auth.Subject.doAs(Subject.java:416)
at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1093)
at org.apache.hadoop.mapred.TaskTracker.initializeJob(TaskTracker.java:1201)
at org.apache.hadoop.mapred.TaskTracker.localizeJob(TaskTracker.java:1116)
at org.apache.hadoop.mapred.TaskTracker$5.run(TaskTracker.java:2404)
at java.lang.Thread.run(Thread.java:636)
Googleで検索したところ、ディスク容量の不足によるものと判明しました.
df-h後に/下のディスクがいっぱいになっていることに気づき、誰が/ディレクトリの下のディスクを占有しているのか分からなかった.
后で同僚の注意のもとでやっと発见して、このいくつかの机械は异なって构造して、10台ぐらいは12のハードディスクを挂けて、6台は10のハードディスクだけを挂けて、だからシナリオで构筑する时すべて12のハードディスクによって书く日志を筑いて、/data 10/data 11の下で书いて、/だからすぐに/ディレクトリは书き込まれていっぱいになりました.
新しい構成から再起動して問題を解決します.