Python正規表現とmatch関数の使い方

1602 ワード

正規表現(Regular Expression)は、一連の構文規則を記述し、一致させるために単一の文字列を使用する文字列です.REと略す.REは爬虫類の基礎モジュールであり、電話番号、身分証明書番号、メールボックス、ユーザー名とパスワード、urlアドレスなどを検証するために使用することができる.
操作手順
呼び出しreモジュール(pythonに埋め込むパケット)import reはmatchまたはsearchメソッドを用いてマッチング操作a=reを行う.match(pattern,string,flags=0)patternマッチングルールモードstringマッチングする文字列マッチングデータは、通常groupなどの方法で抽出され(文字列フォーマット)、groups(すべてのパケットメタグループフォーマット)
import re
try:
    pattern=r'(\w+) (\w+)(?P.)*'
    string='   asd123!!!'
    a=re.match(pattern,string)
    print('    ,   :',a.group)
except:
    print('    !')

出力->マッチングに成功し、結果は:苔asd
match関数のプロパティ
string:マッチング時に使用するテキストre:マッチング時に使用するpattrenオブジェクトpos:テキスト内の正規表現が検索を開始するインデックス.値はPattern.match()とPattern.seach()メソッドの同名パラメータは同じです.endpos:テキスト内の正規表現が検索を終了するインデックス.値はPattern.match()とPattern.seach()メソッドの同名パラメータは同じです.Lastindex:最後にキャプチャされたパケットのテキスト内のインデックス.キャプチャされたパケットがない場合はNoneになります.Lastgroup:最後にキャプチャされたパケットの別名.このパケットに別名がないか、キャプチャされていないパケットがある場合はNoneになります.
match関数の方法
group関数で、1つ以上のパケットの文字列を取得します.start関数は、string内の指定したグループによってキャプチャされたサブストリングの開始インデックスを返します.end関数は、string内の指定されたグループによってキャプチャされたサブストリングの終了インデックスを返します.span関数は、string内の指定されたグループによってキャプチャされたサブストリングの終了インデックスを返します.expand関数は、一致したパケットをtemplateに代入して返します.
個人的な理解:matchメソッドはsearchメソッドと似ていますが、searchメソッドは文字列の中間のデータに一致するために使用され、matchメソッドは最初から取得するしかありません.