【データセット処理】Pythonはxmlファイルに基づいて画像にターゲットを表示する


自分のデータセットの寸法が正確かどうかを判断したい場合は、xmlファイルの座標やピクチャ情報に基づいて、ピクチャにターゲットボックスを出して別のフォルダに保存することができます.データセットは一般的に多くのピクチャであるため,一括処理方式で寸法を付けた.
# -*- coding: utf-8 -*-
#    img xml  ,  xml       img        ,         ,               。
import xml.etree.ElementTree as ET
import os, cv2
from tqdm import tqdm

annota_dir = '/home/dlut/  /make_database/     /Annotations_xml'
origin_dir = '/home/dlut/  /make_database/     /JpGImages_img'
target_dir1='/home/dlut/  /make_database/     /123456'

def divide_img(oriname):
    img_file = os.path.join(origin_dir, oriname + '.jpg')
    im = cv2.imread(img_file)

    xml_file = os.path.join(annota_dir, oriname + '.xml')  #         xml  
    tree = ET.parse(xml_file)
    root = tree.getroot()
#im = cv2.imread(imgfile)
    for object in root.findall('object'):
        object_name = object.find('name').text
        Xmin = int(object.find('bndbox').find('xmin').text)
        Ymin = int(object.find('bndbox').find('ymin').text)
        Xmax = int(object.find('bndbox').find('xmax').text)
        Ymax = int(object.find('bndbox').find('ymax').text)
        color = (4, 250, 7)
        cv2.rectangle(im, (Xmin, Ymin), (Xmax, Ymax), color, 2)
        font = cv2.FONT_HERSHEY_SIMPLEX
        cv2.putText(im, object_name, (Xmin, Ymin - 7), font, 0.5, (6, 230, 230), 2)
        cv2.imshow('01', im)

    img_name = oriname + '.jpg'
    to_name = os.path.join(target_dir1, img_name)
    cv2.imwrite(to_name, im)

img_list = os.listdir(origin_dir)
for name in img_list:
    divide_img(name.rstrip('.jpg'))

1枚を処理したり、1枚を処理したりすることもできます.
# -*- coding: utf-8 -*-
#       xml  ,         
import xml.etree.ElementTree as ET
import os, cv2

xml_file = '/home/dlut/  /make_database/     /Annotations_xml/000002_  0.xml'
tree = ET.parse(xml_file)
root = tree.getroot()
imgfile = '/home/dlut/  /make_database/     /JpGImages_img/000002_  0.jpg'
im = cv2.imread(imgfile)
for object in root.findall('object'):
    object_name = object.find('name').text
    Xmin = int(object.find('bndbox').find('xmin').text)
    Ymin = int(object.find('bndbox').find('ymin').text)
    Xmax = int(object.find('bndbox').find('xmax').text)
    Ymax = int(object.find('bndbox').find('ymax').text)
    color = (4, 250, 7)
    cv2.rectangle(im, (Xmin, Ymin), (Xmax, Ymax), color, 2)
    font = cv2.FONT_HERSHEY_SIMPLEX
    cv2.putText(im, object_name, (Xmin, Ymin - 7), font, 0.5, (6, 230, 230), 2)
    cv2.imshow('01', im)
cv2.imwrite('/home/dlut/  /make_database/     /000002_0(1).jpg', im)