正規表現教程のサブ表現の使い方分析


本論文の実例は正規表現教程のサブ表現の使い方を述べている。皆さんに参考にしてあげます。具体的には以下の通りです。
注:すべての例で正則表現のマッチング結果はソーステキストの「和」の間に含まれています。Java自身の正則表現の使い方であれば、該当する箇所で説明します。javaの例は全部JDK 1.6.0_にあります。13でテストに合格します。
一、問題の導入
まず一つの例を見ると、Windows 2000など複数の単語で構成されていますが、全体としてはHTMLページでは非改行スペースが使えます。つまりnon-breeaking spaceはブラウザに一行を表示させ、現在はこのようなスペースを複数マッチングさせます。
テキスト:Your operation systems Windows nbsp;2000.
正規表現:nbsp;2,}
結果:Your operation systems Windows nbsp;2000.
解析:ここでは2つ以上の非改行スペースにマッチしたいパターンを使用していますが、結果から分かるように、nbspにマッチしていないことが分かります。このモードはnbspのようにしかマッチできません。このようにnbspで始まり、2つ以上の連続して番号付けされたテキストです。
前に述べたように繰り返しマッチングは元の文字にマッチする前の文字の繰り返しです。しかし、文字列を何度も合わせたいなら、どうすればいいですか?
二、サブ表現
上からサブ表現を引き出します。サブ表現は大きな表現の一部であり、一つの表現を複数のサブ表現に分割する目的は、それらのサブ表現を独立した要素として扱うためである。サブ表現は(と)で囲まなければなりません。だから、前の例では正規表現は(nbsp;){2,}
有効な年にマッチする規則を見てください。
テキスト:1988-11-13
正規表現:(19|20)\d{2}
結果:【1988】-11-13
解析:この例では、意味のない年を排除するために、年の最初の2桁の数字を19または20に限定し、|は正規表現またはオペレータである。ここでは19|20をサブ表現に入れなければなりません。つまり(19|20)、そうでなければ20年の最初の年にマッチします。
三、サブ表現のネスト
サブ表現はネストを可能にし,多層ネスティングを可能にし,ネスト層は理論的に制限されていない。
式((A)(B(C))には、次のようなサブ表現があります。
1   ((A)(B(C)))
2   (A)
3   (B(C)
4   (C)
合計4つ、0番目は常に表現全体を表します。後のトレース参照では、(nはサブテーブル式の番号です)を通してサブ表現を参照するように紹介されます。
サブ表現ネストの例は、IPV 4アドレスに対応する後の正規表現を参照することができる。
PS:ここでもう2つの非常に便利な正規表現ツールを提供します。
JavaScript正規表現はオンラインテストツールです。
http://tools.jb51.net/regex/javascript
正規表現のオンライン作成ツール:
http://tools.jb51.net/regex/create_reg
本論文で述べたように、皆さんの正規表現学習に役に立ちます。