labelImgで生成されたxmlファイルを一括修正します.
32338 ワード
tenssorflowを使ってターゲット検出画像をデータトレーニングする場合は、大量の画像を表示する必要があります.この仕事量は本当に多い.より簡単に画像を表示するために、またはトレーニングセットを追加します.
次のように操作します
まず、各種類の画像に100-200枚ずつ表示して訓練します.
訓練精度の向上が完了したら、表示されていない画像(テストセット)を予測します.
予測ペアの画像を人工的に分離し、検出対象の画像の検出枠データに基づいて、トレーニングセットを追加するための新しいxmlを生成する.
前に対応するxmlファイルのテンプレートがありますので、前のxmlファイルを修正してもいいです.変更コード:
次のように操作します
まず、各種類の画像に100-200枚ずつ表示して訓練します.
訓練精度の向上が完了したら、表示されていない画像(テストセット)を予測します.
予測ペアの画像を人工的に分離し、検出対象の画像の検出枠データに基づいて、トレーニングセットを追加するための新しいxmlを生成する.
前に対応するxmlファイルのテンプレートがありますので、前のxmlファイルを修正してもいいです.変更コード:
import os
from xml.etree.ElementTree import ElementTree,Element
def read_xml(in_path):
''''' xml
in_path: xml
return: ElementTree'''
tree = ElementTree()
tree.parse(in_path)
return tree
def write_xml(tree, out_path):
''''' xml
tree: xml
out_path: '''
tree.write(out_path, encoding="utf-8", xml_declaration=True)
def if_match(node, kv_map):
'''''
node:
kv_map: map'''
for key in kv_map:
if node.get(key) != kv_map.get(key):
return False
return True
# ----------------search -----------------
def find_nodes(tree, path):
'''''
tree: xml
path: '''
return tree.findall(path)
def get_node_by_keyvalue(nodelist, kv_map):
''''' ,
nodelist:
kv_map: map'''
result_nodes = []
for node in nodelist:
if if_match(node, kv_map):
result_nodes.append(node)
return result_nodes
# ---------------change ----------------------
def change_node_properties(nodelist, kv_map, is_delete=False):
''' / /
nodelist:
kv_map: map'''
for node in nodelist:
for key in kv_map:
if is_delete:
if key in node.attrib:
del node.attrib[key]
else:
node.set(key, kv_map.get(key))
def change_node_text(nodelist, text, is_add=False, is_delete=False):
''''' / /
nodelist:
text : '''
for node in nodelist:
if is_add:
node.text += text
elif is_delete:
node.text = ""
else:
node.text = text
def create_node(tag, property_map=None, content=None):
'''
tag:
property_map: map
content:
return '''
element = Element(tag,content, property_map)
element.text = None
return element
def add_child_node(nodelist, element):
'''''
nodelist:
element: '''
for node in nodelist:
node.append(element)
def del_node_by_tagkeyvalue(nodelist, tag, kv_map):
''''' ,
nodelist:
tag:
kv_map: '''
for parent_node in nodelist:
children = parent_node.getchildren()
for child in children:
if child.tag == tag and if_match(child, kv_map):
parent_node.remove(child)
def get_xml(input_dir):
xml_path_list = []
for (root_path,dirname,filenames) in os.walk(input_dir):
for filename in filenames:
if filename.endswith('.xml'):
xml_path = root_path+"/"+filename
xml_path_list.append(xml_path)
return xml_path_list
if __name__ == "__main__":
input_dir ="./"
xml_path_list = get_xml(input_dir)
for xml_file in xml_path_list:
################ 1. xml ##########
root = read_xml(xml_file)
data = [[1, 1, 1],
["abc",1, 1, 1,1],
["ABC",1, 1, 1,1]]
#
size = root.find('size')
size.find('height').text = "new text111"
size.find('width').text = "new text111"
size.find('depth').text = "new text111"
# Find annotations.
Object = root.findall('object')
for i in range(len(Object)):
if len(Object) ==2:
# change_node_text(Object[i].find('name'),str(data[i+1][0]))
Object[i].find('name').text = str(data[i+1][0]) #
Object[i].find('bndbox').find('ymin').text = str(data[i+1][1]) #
Object[i].find('bndbox').find('xmin').text = str(data[i+1][2])
Object[i].find('bndbox').find('ymax').text = str(data[i+1][3])
Object[i].find('bndbox').find('xmax').text = str(data[i+1][4])
else:
# change_node_text(Object[0].find('name'),"new text")
Object[0].find('name').text = str(data[1][0]) #
Object[0].find('bndbox').find('ymin').text = str(data[1][1]) #
Object[0].find('bndbox').find('xmin').text = str(data[1][2])
Object[0].find('bndbox').find('ymax').text = str(data[1][3])
Object[0].find('bndbox').find('xmax').text = str(data[1][4])
del_parent_nodes1 = find_nodes(Object[1], "object/name")
del_parent_nodes2 = find_nodes(Object[1], "object/pose")
del_parent_nodes3 = find_nodes(Object[1], "object/truncated")
del_parent_nodes4 = find_nodes(Object[1], "object/difficult")
del_parent_nodes5 = find_nodes(Object[1], "object/bndbox")
del_parent_nodes6 = find_nodes(Object[1], "object/bndbox/ymin")
del_parent_nodes7 = find_nodes(Object[1], "object/bndbox/xmin")
del_parent_nodes8 = find_nodes(Object[1], "object/bndbox/ymax")
del_parent_nodes9 = find_nodes(Object[1], "object/bndbox/xmax")
Element.remove(del_parent_nodes1)
Element.remove(del_parent_nodes2)
Element.remove(del_parent_nodes3)
Element.remove(del_parent_nodes4)
Element.remove(del_parent_nodes5)
Element.remove(del_parent_nodes6)
Element.remove(del_parent_nodes7)
Element.remove(del_parent_nodes8)
Element.remove(del_parent_nodes9)
################ ##########
write_xml(root, "HKEN111113.xml")