Atomで正規表現入門


はじめに

  • Atomエディタで正規表現を勉強したのでメモ残しといた。
  • 文字列の検索、 「.*」「Aa」 で正規表現を有効にして、小文字と大文字を区別も有効にする
  • 文字列で検索するときその文字列をリテラルという

数字. ~~~ で「数字. 」を削除

  • ^\d+.\s :数字+ピリオド+空白 を選択できる
  • あとはから文字とかで置き換えればおけ

メタ文字

  • ドット「.」:改行を除く任意の1文字
  • バックスラッシュ「\」:メタ文字を文字として検索できる。エスケープする
  • 「\d」:0-9 数字1文字。大文字「\D」だと\d以外を選択
  • 「\w」:a-z A-Z 0-9 1文字を表す。大文字「\S」だと\s以外を選択
  • 「\s」:スペース、タブ、改行とか。大文字「\W」だと\w以外を選択

量指定子:直前の繰り返しを回数で指定できる

  • {n}:n個繰り返し
  • {min,max}:min以上、max以下。電話番号03-~と080~を同時に指定とかできる
  • {min,}:min以上
  • ?:0以上1以下
  • +:1以上
  • *:0以上
  • 量指定子はデフォルトで一番長いものをとってくる。それを防ぐには量指定子のあとに「?」をつけてあげれば一番短いものをもってくるのでおけ。

アンカー

  • ハット「^」:行の先頭。キャレットていうみたい
  • ダラー「$」:行の最後
  • 「\b」:単語の境界。前後が空白のものを選択する

選択子

  • 「|」:複数選択ができる。例 123 | abc 123かabcが選択できる。 abc.(com|cool) abc.comかabc.coolを選択できる

文字クラス

  • 大括弧[]:大括弧ないのどれか1文字をさす。例 [abc] abcのどれか1文字ではじまる
  • 「[^]」:大括弧のなかの直後のみ否定のいみ
  • 「[-]」:大括弧のなかで文字コード表にしたがって、範囲を意味する
  • 大括弧のなかではエスケープする文字列がちがう

改行とタブ

  • \t:タブ
  • \r\n:windows
  • \r:v9までのmac
  • \t:v9以降のmac
  • \r\n|\t|\r:全てのOS

キャプチャ

(.+),\s?(.+)$ これで検索
$1 これで置き換え

google
dotinstall
yahoo

後方参照

  • (\d),\1:後方から参照できる

まとめ

以上