pythonはファイルに不要なデータをフィルタリングする

4519 ワード

import re

# 
file_open = open(r"d:\ \ 1.txt","r",encoding='utf-8')
file_open2 = open(r"d:\ \ .txt","r",encoding='utf-8')

s = file_open.read().splitlines()
ss = file_open2.read()
ss_list = ss.splitlines()
print(ss_list)
result = []
for i in s:
# 
    regular = "([0-9A-Za-z,]*{0}[0-9A-Za-z,]*)".format(i)
    result1 = re.findall(regular,ss)
    result = result + result1
# 1: list list
# result_2 = list(set(ss_list) - set(result))
# 
file = open(r"d:\ \ .txt",'w')
# for j in result_2:
#     file.write(j + '
')
# 2:if for j in ss_list: if j not in result: file.write(j+'
'
) file_open.close() file_open2.close() file.close()

適用シーン:たとえばテスト中にファイルの中のあるテーブルに対応するデータをフィルタリングする必要があり、テーブルの中のフィールドデータを抽出してファイルに入れ、スクリプトを実行し、直接データをフィルタリングすることができ、正規表現を修正するだけで対応する異なるデータをフィルタリングすることができる.