機械学習などに使う画像データセットをGoogleから無料で簡単にダウンロードする方法


必要なモジュールをインストール

まずは下のコマンドでchromedriverというモジュールをインストールします。
brew cask install chromedriver
Homebrewをまだインストールしていない場合は、
https://qiita.com/pypypyo14/items/4bf3b8bd511b6e93c9f9
このへんの記事を見てみてインストールしてください。

次に、
pip install google_images_download
を実行します。

最後に、
which chromedriver
でchromedriverのパスを確認します。筆者のMacの場合は /usr/local/bin/chromedriver と表示されました。

画像をダウンロード

そして、欲しい画像をダウンロードします。

google-images-downloadで100個以上のイメージを取得する場合、chromedriverのパスを指定する必要があります。 今回は最大で1000件集めます。

上記で確認したchromedriverのパスを指定します。私の環境では/usr/local/bin/chromedriverでした。
例えば文鳥についての画像をダウンロードしたければ、
googleimagesdownload --keywords "文鳥,Java Sparrow" -l 1000 --chromedriver /usr/local/bin/chromedriver
を実行すればよいです。すると、実行したディレクトリにdownloadsというディレクトリが生成され、その中に文鳥、Java Sparrowという名前のディレクトリも生成されていると思います。

これで完了です。欲しい画像の名前を"文鳥,Java Sparrow"のところに書けばOKです。