【Python】多重分類問題のTraining, Validation, Testフォルダーを簡単に作る方法


はじめに

多重分類問題(Multi Classes Classification)において、自前の画像データをTraining, Validation, Testに分ける方法を紹介します。

やりたいこと

自分が持っている画像データが下記の図のようにinputフォルダーにあるとします。


その画像データを下記の図のようにtraining, Validation, Testフォルダーに分けたいと思います。

インストール方法

pip install split-folders

使い方

Pythonプログラムを作成します。split-foldersモジュールをインポートして、下記のコードを実行します。

import split_folders

# Split with a ratio.
# To only split into training and validation set, set a tuple to `ratio`, i.e, `(.8, .2)`.
split_folders.ratio('input_folder', output="output", seed=1337, ratio=(.8, .1, .1)) # default values


関連資料

  1. [Split Folders]https://github.com/jfilter/split-folders