AzureMachineLearningStudioを使用した学習の振り返り


はじめに

昨年末~今年春ぐらいまでにかけて、実施したUdemyの機械学習関連講座の学習に、AzureMachineLearningStudioを使用した際の振り返りです。

スキルレベル

  • Python初心者 Udemyで初めて「jupyter notebook」を知った程度
  • Linux初心者 コマンドを少し知っている程度

なぜAzureMachineLearningで実施しようと思ったか

  • 自分のPCがあまりに非力で、GPUとかも使用できない。
  • 2019年12月のIgniteで、AzureMachineLearningの話が出ていて興味があった。
  • Azureは使用できる環境を持っていた。
  • その他のサービスを知らなかった。

使用方法

  1. 以下に、ログイン。
    https://ml.azure.com/
  2. 最初にコンピューティングから実行するVMを作成する。
    作成されたマシンは、自動で開始状態となる。
    節約のため、未使用時には、VMを停止しておく。 GPUを利用したいときには、こちらでコンピュータリソースを変更する。
    当時は、通常のAZURE仮想マシンを作成する画面で、その中からCPU/GPU等も選択しないといけなかったですが、現在は以下の画面用に選択しやすくなっています。
  3. Notebooksで、新規作成し、作成したコンピューティングリソースから選択して使用をする。

当時苦労したこと

  • 学習コンテンツのTensorflowのバージョンが1.14なのに、Azure上の環境が2.0だった。
    → 「ターミナルを開く」からターミナルを開いて、つたない知識で Tensorflowをインストールすることができた
    pip install tensorflow==1.14
    → コマンドでの実行もそのターミナルから実施できた。
  • サービス自体の動作が不安定であった。
    ComputeのStartとStopがエラーで実行出来なくなることが良くあった。 → 再ログインや日を置いての実行をしていた。
  • ノートブックにて、Jupyterで編集しようとすると、504 Geteway Time-out となって使えなかった。
    → AzuleMLからログアウトして、複数アカウントでのログインを全て破棄。ブラウザも再起動。 さらに、作成した仮想マシンを再起動したら再起動中のままになってしまったので仮想マシンも作り直し対応。
  • 作成できるVMのサイズがAzure側の設定で変更されていて、作成したいサイズがなくなっていた。
    → 仕方ないので、別のサイズで対応。
  • 色んな条件のVMを作成していたら、VMが作成できなくなった。
    →作成できるVM の合計コア数の上限エラーであった。リージョンあたり20であったため、使用頻度の少ないVMを削除。

当時感動したこと、良かったこと。

  • GPUが使用できた、GPUの威力が実感できたこと。
    6万のテストデータで、CNNをお試し実行した際に、CPUだと120秒かかったものが、GPUだと8秒だった。
  • クラウド環境なので当たり前ですが、場所や使用するPCを気にせず実行できたこと。
    会社のPCでも自宅のPCでも、インターネットにつながりml.azureにアクセスできれば使用できた。当時は非常にありがたい環境でした。
  • 学習し、作成した各種PythonのプログラムもAzureMachineLearning上に保存できるので、便利でした。

おわりに

春以降、機械学習については、courseraの「Machine learning」講座を受講してみたりしたが、AzureMachineLearningについては、春以降利用できていない。またAzureMLの利用も
進めていけたらと思います。今後は、業務DBのデータを利用したMLを実施していきたいです。
(まったく話変わりますが、上記coueseraの講座非常に有意義でした。)

※記載内容に誤りや不適切な文言ありましたら、ご指摘いただけますと幸いです。
 ありがとうございました。