hdfsの容量が枯渇した時に大きいファイルを探す方法
hdfsの容量枯渇でhadoopが動作しなくなり、てんやわんやしたので一時対応方法を残しておく。
コマンド一覧
https://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-common/FileSystemShell.html#df
ディスクの確認をする
hadoop fs -df -h
hadoop dfsadmin -report
フォルダとファイルの使用量確認
フォルダごとのディスク使用量を確認
hadoop fs -du -s /${folder}/* | sort -n
ファイルごとのサイズを確認
hadoop fs -du /${folder}/* | sort -n
削除方法
ファイルの削除方法
hadoop fs -rm ${file}
フォルダ内のファイルを全部削除する方法
hadoop fs -rm -r /${folder}/*
しかしこれだけだとtrashフォルダに移動するだけなので、trashも削除する必要がある。
hadoop fs -expunge
か以下コマンドで削除をする
hadoop fs -rm -r /user/${whoami}/.Trash/*
まとめ
そもそもhdfsのディスク監視の必要性があるのでは。
Author And Source
この問題について(hdfsの容量が枯渇した時に大きいファイルを探す方法), 我々は、より多くの情報をここで見つけました https://qiita.com/picapica/items/cac6ccffb984c1344b02著者帰属:元の著者の情報は、元のURLに含まれています。著作権は原作者に属する。
Content is automatically searched and collected through network algorithms . If there is a violation . Please contact us . We will adjust (correct author information ,or delete content ) as soon as possible .