Python学習基礎整理--str.split()とre.split()(四)
1660 ワード
str.split()
説明
split()は、区切り記号を指定して文字列をスライスし、パラメータnumに指定値がある場合はnumサブ文字列のみを区切ります.
構文
パラメータ str--スペース、改行()、タブ(t)など、デフォルトではすべての空白文字です. num--分割回数.
str.splitは正則及び複数の切断記号をサポートせず、例えばスペースで切断するなど、スペースの数を感知しない.したがってsplitは単純な文字分割にのみ適しています
re.split()
正規および複数の文字カットをサポート
詳細:http://www.mknight.cn
説明
split()は、区切り記号を指定して文字列をスライスし、パラメータnumに指定値がある場合はnumサブ文字列のみを区切ります.
構文
str.split(str="", num=string.count(str)).
パラメータ
str.splitは正則及び複数の切断記号をサポートせず、例えばスペースで切断するなど、スペースの数を感知しない.したがってsplitは単純な文字分割にのみ適しています
re.split()
正規および複数の文字カットをサポート
>>> print line
abc aa;bb,cc | dd(xx).xxx 12.12' xxxx
>>> re.split(r' ',line)
['abc', 'aa;bb,cc', '|', 'dd(xx).xxx', "12.12'\txxxx"]
[]
>>> re.split(r'[ ]',line)
['abc', 'aa;bb,cc', '|', 'dd(xx).xxx', "12.12'\txxxx"]
:\s([\t
\r\f\v])\S( [^\t
\r\f\v]
>>> re.split(r'[\s]',line)
['abc', 'aa;bb,cc', '|', 'dd(xx).xxx', "12.12'", 'xxxx']
>>> re.split(r'[;,]',line)
['abc aa', 'bb', "cc | dd(xx).xxx 12.12'\txxxx"]
>>> re.split(r'[;,\s]',line)
['abc', 'aa', 'bb', 'cc', '|', 'dd(xx).xxx', "12.12'", 'xxxx']
,
re.split('([;])',line)
['abc aa', ';', "bb,cc | dd(xx).xxx 12.12'\txxxx"]
# ,
, ?:
>>> re.split(r'(?:;)',line)
['abc aa', "bb,cc | dd(xx).xxx 12.12'\txxxx"]
詳細:http://www.mknight.cn