python不定区切り子に対して文字列を切り出す方法
問題:砂ぼこりのようなデータから文字を抽出する必要があります。区切り記号は一つだけでなく、スペースもたくさんあります。
元の文字列は以下の通りです。
処理結果は以下の通りです。
元の文字列は以下の通りです。
'asd ff gg; asd , foo| og '
上のものを削除したいです。区切り記号と余分なスペースから抽出します。
['asd', 'ff', 'gg', 'asd', 'foo', 'og']
このような一般的な処理ログやウェブページデータの抽出に使用されますが、一般的にこのようなデータに必要なデータ分布の規則性はあまり強くなく、分散しています。処理結果は以下の通りです。
import re
line = 'asd ff gg; asd , foo| og '
data = re.split(r'[;,|\s]\s*',line)
for i in data:
if i == '':
data.remove(i)
print(data)
以上のpythonは不定区切り文字をカットして文字列を抽出する方法は小編集で皆さんのすべての内容を共有しています。参考にしていただければと思います。どうぞよろしくお願いします。