Google Colaboratoryを使ったRNNの動作確認(2022年3月30日)


1. はじめに

 YOLO・CNNといったニューラルネットワークを使った機械学習を勉強中の者です。この手のコモディティ化以前のテクノロジーの学習で障害となるのは、プラットフォームやソフトウェアライブラリ等がどんどんアップデートされているので、ほんのちょっと前に書かれた記事であっても、書かれた通りに動かすことができないという点です(筆者も度々遭遇して難儀しています)。
 つい昨晩、RNNに挑戦したところ、やはり参考にさせて頂いたサイト記事の通りには実行できず、いろいろとネット上を調べまわった結果、何とか動かすことができましたので、自分用の備忘録を兼ねて記録しておきたいと思います。

2. 参考にさせて頂いたサイト記事

RNN(回帰的ニューラルネットワーク)とは?Pythonでの実装方法と一緒に見ていこう!
https://toukei-lab.com/rnn
更新日 2021年9月14日

3. Google Colabratoryの準備

 参考にさせて頂いたサイト記事ではPythonの動作環境を特定していませんでしたが、本記事を参考にして0からやってみようという方のために、最も手軽に試せるGoogle Colaboratoryの操作手順を含めて説明していきたいと思います。

3-1 Google Colabratoryとは?

 Googleがブラウザ上で動作するPythonの実行環境として提供しているものです。計算能力をフルに使える有料プランもありますが、物凄く大規模なデータでの使用でなければフリープランで十分です。大学の研究なども概ねフリープランでOKでしょう。何といっても優れている点は、Python実行環境のインストールが不要といういう点です。また、標準で用意されているライブラリが常に最新の状態にキープされている点も重要です。また、フリーでもGPUが使用可能なこともありがたいです。ニューラルネットワークの学習には多くの計算量が必要で、貧弱な環境ではちょっとした学習でも1晩とか必要になったりしますが、GPUを使うだけで10倍くらい速く動かせます(ただしフリープランでは連続使用時間等に制限あり)。計算はすべてGoogle側の計算リソースを使いますから、手元も計算機の能力依存しない点も重要です(どんなpoorなパソコンからアクセスしても利用できる計算能力は同じということです)。ちなみに、colaboratoryという単語が聞きなれないなぁ、と筆者も思ったのですが、綴りをよく見たところlaboratory(研究室、研究所)にcoを付けた造語のようです。coには共同で作業するなどの意味がありますので、共同研究室といった意味合いなのでしょう。

3-2 Google Colaboratoryへのアクセス

 比較してませんが、Googleの提供するサービスですから、ブラウザとしてはGoogle Chromeを使うのがベストだと思います。なので以下はGoogle Chromeの使用を前提としています。まずはGoogle Chromeで次のサイトにアクセスしましょう。
https://colab.research.google.com/?hl=ja

 まずはログインをして下さい。もちろんGoogleアカウントが必要ですので、持っていない方は次のサイト記事などを参考にして作成して下さい。
Google アカウントの作成
https://support.google.com/accounts/answer/27441?hl=ja&msclkid=87679f13afa211ecbd0751ca8ded7ff0

3-3 ワーク領域の作成

 ログイン後は次のような画面が表示されます。

 ここで、右下の「ノートブックを新規作成」を押します。”ノートブック”というのは、MicrosoftやAdobeのアプリではプロジェクトに相当するものだと思えばよいと思います。なお、プログラム毎に異なるワーク領域(名前は後で変更できます)を用意することで、使い分けもできます。新規作成すると、次のような画面が現れます。

 これでもうPythonが実行できます。

4. RNNプログラムの実行

4-0 Hello World!

 言語の種類を問わず、プログラミングの学習で最初にやるべきことは、Hello Worldですね。僕もこれをやると落ち着くのでついやります。黒丸に白矢印のアイコンの右にある空白領域(デフォルトでここが選択状態になっています)に、
print("Hello World!")
と打ちましょう。実行は、黒丸に白矢印のアイコンをマウスで左クリックします。最初は初期化処理が走るので、5秒くらい待たされますが、次のように表示されます。

4-1 RNN用テストデータの入手とアップロード

 プログラムを作る前に、RNNの動作確認用のデータを入手しておきます。
Kaggle-“Air Passenger”
https://www.kaggle.com/datasets/rakannimer/air-passengers
 某航空会社の1959~1961年までの月毎の乗客数のデータだそうです。ダウンロードの際にログインを求められますので、Googleアカウントをそのまま使うのが簡単です。ダウンロードに成功すると、次のファイルが入手できます。
AirPassengers.csv
 今度は、これをGoogle Colaboratoryにアップロードします。まずは画面の左端に並んでいるフォルダアイコン(マウスカーソルを載せると”ファイル”と表示されますがw)を左クリックして下さい。次のような画面になります。

 次に、アップロードのアイコン(文書に上向き矢印)を押し、入手したCSVファイルを指定します。アップロードに成功すると次のようになります(リサイクル時に削除されます、という警告が出ますが無視でOKです)。

4-2 RNNのPythonコード

 新しいコード記述領域を確保します。上部真ん中辺りにある”+ コード”と書かれたアイコンをクリックすると次のようになります。

4-2-1 インポート

 まずは必要なライブラリをインポートします。
 ここではやはりGoogleが提供しているTensorflowというニューラルネットワーク計算用ライブラリを使用しますが、デフォルトで入っていないtflearnというものを導入しておきます。

pip install git+https://github.com/tflearn/tflearn.git

 導入に成功すると次のようになります。

 また新しいコード領域を確保し、次のインポートを実行します。

import tensorflow
import tflearn
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split

4-2-2 テスト用データの読み込みと初期化

 アップロードしたCSVデータの読み込みと、それを教師データ・推論データにわけるコードを記述して実行します。

tensorflow.compat.v1.reset_default_graph()

df = pd.read_csv('AirPassengers.csv',usecols=[1])
dataset = df.values
dataset = df.astype('float32')
dataset = (dataset - np.min(dataset))/(np.max(dataset)-np.min(dataset))

dataset = np.array(dataset)

def create_dataset(dataset, steps_of_history, steps_in_future):
    X, Y = [], []
    for i in range(0, len(dataset)-steps_of_history, steps_in_future):
        X.append(dataset[i:i+steps_of_history])
        Y.append(dataset[i + steps_of_history])
    X = np.reshape(np.array(X), [-1, steps_of_history, 1])
    Y = np.reshape(np.array(Y), [-1, 1])
    return X, Y

def split_data(x, y, test_size=0.1):
    pos = round(len(x) * (1 - test_size))
    trainX, trainY = x[:pos], y[:pos]
    testX, testY   = x[pos:], y[pos:]
    return trainX, trainY, testX, testY

steps_of_history = 1
steps_in_future = 1
X, Y = create_dataset(dataset, steps_of_history, steps_in_future)
trainX, trainY, testX, testY = split_data(X, Y, test_size = 0.33)

4-2-3 ニューラルネットワークの定義

 次のコードを入力して実行し、ニューラルネットワークを定義します。

net = tflearn.input_data(shape=[None, steps_of_history, 1])
net = tflearn.lstm(net, n_units=6)
net = tflearn.fully_connected(net, 1, activation='linear')
net = tflearn.regression(net, optimizer='adam', learning_rate=0.001,
        loss='mean_square')
model = tflearn.DNN(net, tensorboard_verbose=0)


 警告が出ますが無視で。

4-2-4 トレーニングの実行

 新しいコード領域を確保して次のコードを入力・実行します。

model.fit(trainX, trainY, validation_set=0.1, batch_size=1, n_epoch=50)

4-2-5 推論の実行

 新しいコード領域を確保して次のコードを入力・実行します。

test_predict = model.predict(testX)
rmse = np.sqrt(np.mean((test_predict-testY)**2))
print(rmse)

 推論の精度がRMSE(二乗平均平方根誤差)が出力されます。

5. おわりに

 以上、2022年3月30日現在、記事内容の通りに実行可能です。参考にさせて頂いたサイト記事からの変更点は以下です。
①インポート前のtflearnの導入
②reset_default_graph()をtensorflowのバージョン1で実行