正規表現は、改行を含む任意の文字に一致する書き方です.

1030 ワード

[sD]*改行とスペースの一致
今日は正規表現を使用して、テキストの任意の文字を取得したいと思います.
(.*)結果が実行されてから、改行後のテキストが得られないことに気づきました.
そこでマニュアルを調べてみると、正規表現の「.」(点記号)は、改行記号「」以外のすべての文字に一致します.また、マニュアルには「」を含む任意の文字を一致させるには、「[.]」のように使用してください.を選択します.
正規表現の一致規則を次のように変更しました:([.]*)もちろん、C#プログラムに直接書かれている場合は([.]*)に変更して再度プログラムを実行する必要があり、何も取れないことに気づきました.
私はどうしても理解できず、また以下のルールに変更しました:([.|]*)および(.]*)結果はやはりだめで、何も取れません.点記号と改行符に力が入っているようですね~そしてネットで調べてみると、上記のルールがどこに問題があるのかはわかりませんが、一つの解決策が見つかりました.「([wW]*)」で表します.
([\s\S]*?)疑問符を付けると最短マッチング
俗人の1つの小さい时最も奇怪な1度の交通事故が発生して、私は学友の自転车に乗って、彼は私を连れて向こうの自転车に乗ってぶつかっていっしょに、私は倒れて下りて、彼は向こうの自転车の蛇口の上で座って、また人の首を抱いて
#coding=utf8

'''
Created on 2016 7 16 

@author: root
'''
import re
f=open('E:\\qiushibaike\\03\\page_1.html','r')
html=f.read()
p1=re.compile("

.*

") m1=re.findall(p1,html) p2=re.compile('
[\s\S]*?
') m2=re.findall(p2,html) if m1: for i in m1: print i if m2: for i in m2: print i