pytorchデータセット構築datasets
4360 ワード
pytorchにはDatasetクラスが内蔵されており、トレーニング、テストデータセットを独自の任意のデータで構築できます.使用するときは自分でクラスを定義する必要があります.所有する必要があります.len__、 __ getitem__クラス、データセットの長さを取得し、データセットの内容を反復します.
以下に、データセットクラスを自主的に構築する例を示します.
__ init__:初期化関数は、データセットのいくつかのパラメータを定義するために使用されます._len__:データセットの長さを返します.getitem__:データセットの反復に使用します.
以下は呼び出し方法です.
以下に、データセットクラスを自主的に構築する例を示します.
class FaceLandmarksDataset(Dataset):
"""Face Landmarks dataset."""
def __init__(self, csv_file, root_dir, transform=None):
"""
Args:
csv_file (string): Path to the csv file with annotations.
root_dir (string): Directory with all the images.
transform (callable, optional): Optional transform to be applied
on a sample.
"""
self.landmarks_frame = pd.read_csv(csv_file)
self.root_dir = root_dir
self.transform = transform
def __len__(self):
return len(self.landmarks_frame)
def __getitem__(self, idx):
img_name = os.path.join(self.root_dir,
self.landmarks_frame.iloc[idx, 0])
image = io.imread(img_name)
landmarks = self.landmarks_frame.iloc[idx, 1:].as_matrix()
landmarks = landmarks.astype('float').reshape(-1, 2)
sample = {'image': image, 'landmarks': landmarks}
if self.transform:
sample = self.transform(sample)
return sample
__ init__:初期化関数は、データセットのいくつかのパラメータを定義するために使用されます._len__:データセットの長さを返します.getitem__:データセットの反復に使用します.
以下は呼び出し方法です.
face_dataset = FaceLandmarksDataset(csv_file='faces/face_landmarks.csv',
root_dir='faces/')