pythonはファイルに不要なデータをフィルタリングする
4519 ワード
import re
#
file_open = open(r"d:\ \ 1.txt","r",encoding='utf-8')
file_open2 = open(r"d:\ \ .txt","r",encoding='utf-8')
s = file_open.read().splitlines()
ss = file_open2.read()
ss_list = ss.splitlines()
print(ss_list)
result = []
for i in s:
#
regular = "([0-9A-Za-z,]*{0}[0-9A-Za-z,]*)".format(i)
result1 = re.findall(regular,ss)
result = result + result1
# 1: list list
# result_2 = list(set(ss_list) - set(result))
#
file = open(r"d:\ \ .txt",'w')
# for j in result_2:
# file.write(j + '
')
# 2:if
for j in ss_list:
if j not in result:
file.write(j+'
')
file_open.close()
file_open2.close()
file.close()
適用シーン:たとえばテスト中にファイルの中のあるテーブルに対応するデータをフィルタリングする必要があり、テーブルの中のフィールドデータを抽出してファイルに入れ、スクリプトを実行し、直接データをフィルタリングすることができ、正規表現を修正するだけで対応する異なるデータをフィルタリングすることができる.