正規表現で日本語を探す


正規表現で日本語を探す - (UTF-8)

マルチ言語対応

マルチ言語対応アプリの開発を行うときにテンプレートファイルに日本語が混じっていないかを探す。

[^\x01-\x7E\xA1-\xDF]+

bash shell script example

ファイル数が少ないとき

grep -nPo "[^\x01-\x7E\xA1-\xDF]+" $(find . -type f -name "*html")

ファイル数が多いとき

find . -type f -name "*html" | xargs grep -nPoH "[^\x01-\x7E\xA1-\xDF]+"

パスに を含んでいるとき

while read file
do
  grep -nPoH "[^\x01-\x7E\xA1-\xDF]+" "$file"
done < <(find . -type f -name "*html")

while が使いたくないとき

find . -type f -name "*html" -exec grep --color=auto -nPoH "[^\x01-\x7E\xA1-\xDF]+" {} \;

less を使いたいとき

unbuffer find . -type f -name "*html" -exec grep --color=auto -nPoH "[^\x01-\x7E\xA1-\xDF]+" {} \; | less -SR