labelImgで生成されたxmlファイルを一括修正します.

32338 ワード

tenssorflowを使ってターゲット検出画像をデータトレーニングする場合は、大量の画像を表示する必要があります.この仕事量は本当に多い.より簡単に画像を表示するために、またはトレーニングセットを追加します.
次のように操作します
まず、各種類の画像に100-200枚ずつ表示して訓練します.
訓練精度の向上が完了したら、表示されていない画像(テストセット)を予測します.
予測ペアの画像を人工的に分離し、検出対象の画像の検出枠データに基づいて、トレーニングセットを追加するための新しいxmlを生成する.
前に対応するxmlファイルのテンプレートがありますので、前のxmlファイルを修正してもいいです.変更コード:
import os
from xml.etree.ElementTree import ElementTree,Element


def read_xml(in_path):
    '''''     xml  
       in_path: xml  
       return: ElementTree'''
    tree = ElementTree()
    tree.parse(in_path)
    return tree

def write_xml(tree, out_path):
    ''''' xml    
       tree: xml 
       out_path:     '''
    tree.write(out_path, encoding="utf-8", xml_declaration=True)

def if_match(node, kv_map):
    '''''                  
       node:   
       kv_map:          map'''
    for key in kv_map:
        if node.get(key) != kv_map.get(key):
            return False
    return True

# ----------------search -----------------
def find_nodes(tree, path):
    '''''             
       tree: xml 
       path:     '''
    return tree.findall(path)

def get_node_by_keyvalue(nodelist, kv_map):
    '''''               ,    
       nodelist:     
       kv_map:         map'''
    result_nodes = []
    for node in nodelist:
        if if_match(node, kv_map):
            result_nodes.append(node)
    return result_nodes

# ---------------change ----------------------
def change_node_properties(nodelist, kv_map, is_delete=False):
    '''  /   /            
       nodelist:     
       kv_map:      map'''
    for node in nodelist:
        for key in kv_map:
            if is_delete:
                if key in node.attrib:
                    del node.attrib[key]
            else:
                node.set(key, kv_map.get(key))

def change_node_text(nodelist, text, is_add=False, is_delete=False):
    '''''  /  /         
       nodelist:    
       text :       '''
    for node in nodelist:
        if is_add:
            node.text += text
        elif is_delete:
            node.text = ""
        else:
            node.text = text

def create_node(tag, property_map=None, content=None):
    '''      
       tag:    
       property_map:      map
       content:             
       return    '''
    element = Element(tag,content, property_map)
    element.text = None
    return element

def add_child_node(nodelist, element):
    '''''          
       nodelist:     
       element:    '''
    for node in nodelist:
        node.append(element)

def del_node_by_tagkeyvalue(nodelist, tag, kv_map):
    '''''              ,    
       nodelist:      
       tag:     
       kv_map:         '''
    for parent_node in nodelist:
        children = parent_node.getchildren()
        for child in children:
            if child.tag == tag and if_match(child, kv_map):
                parent_node.remove(child)

def get_xml(input_dir):
    xml_path_list = []
    for (root_path,dirname,filenames) in os.walk(input_dir):
        for filename in filenames:
            if filename.endswith('.xml'):
                xml_path = root_path+"/"+filename
                xml_path_list.append(xml_path)
    return  xml_path_list

if __name__ == "__main__":
    input_dir ="./"
    xml_path_list = get_xml(input_dir)


    for xml_file in xml_path_list:
        ################ 1.   xml    ##########
        root = read_xml(xml_file)
        data = [[1, 1, 1],
                ["abc",1, 1, 1,1],
                ["ABC",1, 1, 1,1]]
        #       
        size = root.find('size')
        size.find('height').text = "new text111"
        size.find('width').text = "new text111"
        size.find('depth').text = "new text111"

        # Find annotations.
        Object = root.findall('object')
        for i in range(len(Object)):
            if len(Object) ==2:
                # change_node_text(Object[i].find('name'),str(data[i+1][0]))
                Object[i].find('name').text = str(data[i+1][0])                 #      
                Object[i].find('bndbox').find('ymin').text = str(data[i+1][1])  #       
                Object[i].find('bndbox').find('xmin').text = str(data[i+1][2])
                Object[i].find('bndbox').find('ymax').text = str(data[i+1][3])
                Object[i].find('bndbox').find('xmax').text = str(data[i+1][4])

            else:
                # change_node_text(Object[0].find('name'),"new text")
                Object[0].find('name').text = str(data[1][0])                 #      
                Object[0].find('bndbox').find('ymin').text = str(data[1][1])  #       
                Object[0].find('bndbox').find('xmin').text = str(data[1][2])
                Object[0].find('bndbox').find('ymax').text = str(data[1][3])
                Object[0].find('bndbox').find('xmax').text = str(data[1][4])

                del_parent_nodes1 = find_nodes(Object[1], "object/name")
                del_parent_nodes2 = find_nodes(Object[1], "object/pose")
                del_parent_nodes3 = find_nodes(Object[1], "object/truncated")
                del_parent_nodes4 = find_nodes(Object[1], "object/difficult")
                del_parent_nodes5 = find_nodes(Object[1], "object/bndbox")
                del_parent_nodes6 = find_nodes(Object[1], "object/bndbox/ymin")
                del_parent_nodes7 = find_nodes(Object[1], "object/bndbox/xmin")
                del_parent_nodes8 = find_nodes(Object[1], "object/bndbox/ymax")
                del_parent_nodes9 = find_nodes(Object[1], "object/bndbox/xmax")

                Element.remove(del_parent_nodes1)
                Element.remove(del_parent_nodes2)
                Element.remove(del_parent_nodes3)
                Element.remove(del_parent_nodes4)
                Element.remove(del_parent_nodes5)
                Element.remove(del_parent_nodes6)
                Element.remove(del_parent_nodes7)
                Element.remove(del_parent_nodes8)
                Element.remove(del_parent_nodes9)


        ################          ##########
        write_xml(root, "HKEN111113.xml")