でかすぎる改行なしのsitemap.xml内のURLをLinuxコマンドで調べる


でかすぎる改行なしのsitemap.xml内にurlがいくつ書いてあるか調べたくて、Linuxコマンドでサクッとやってみた。

</url> の後に改行コード入れて、行数を調べることで判定してみる。

sedの出力で改行コードを出すのに\nとか入れてみてもnと文字が出てしまうので、結局コマンドラインから改行そのものを入れた。ダブルクオートではなくシングルクオートで囲まないとうまくいかない。改行前の\も忘れずに。

$ cat sitemap.xml | sed -e 's/<\/url>/<\/url>\
/g' | wc -l

出てきた数値−1がurlの数、のはず。