Azure Machine Learningで自然言語解析をやってみた - 環境構築


はじめに

本記事では、Azure Machine Learning を利用して自然言語解析を行うために必要となる、Notebook 環境の構築を行います。
※Azure Machine Learning Services の話ではありません。

Azure Machine Learning とは

Azure Machine Learning については、こちらの資料が参考になると思います。
Azure Machine Learning アップデートセミナー 20191127 - SlideShare

旧 Azure Machine Learning Studio について

こちらは、2020/1/28 現在でも、これまで同様、利用可能となっています。
ただし、名称については Azure Machine Learning Studio (classic) へ変更になっているため、注意してください。
(クラシックと聞くと、昔の Azure を思い出してしまいますね...)

Azure Machine Learning Studio (classic)

環境情報

本記事に記載の作業については、以下の環境にて実施しています。

OS環境
- OS: macOS Catalina 10.15.2
- ブラウザ: Google Chrome Version 79.0.3945.130 (Official Build) (64 bit)

開発環境構築

Azure Machine Learning の環境を作成します。

リソースの作成

Azure Portal より、[リソースの作成] を選択します。

Azure Marketplace のカテゴリより、[AI + Machine Learning] を選択します。
[Machine Learning] を選択します。

[メイン] タブにて、以下の情報を入力します。
入力後、[確認および作成] を選択します。

入力
- ワークスペース名: <任意のワークスペース名>
- サブスクリプション: <任意のサブスクリプション>
- リソースグループ: <任意のリソースグループ>
- 場所: <任意のリージョン>
- ワークスペースのエディション: Basic または Enterprise

ワークスペースのエディションに Basic と Enterprise の違いについては、Azure Machine Learning の価格 を参照してください。
Basic エディションでは Automated ML や Designer は利用できません。逆に Notebook のみ利用の場合は Basic を選択でも問題ありません。

[レビュー] タブにて、入力内容を確認します。
問題なければ、[作成] を選択し、リソースを作成します。

デプロイが完了したら、[リソースに移動] を選択します。

デプロイしたリソースの [概要] ページにある [新しい Azure Machine Learning Studio を試す] 欄より、[今すぐ起動する] を選択します。

新しい Azure Machine Learning Studio のホーム画面が開くことを確認します。

Notebook 用 VM の作成

Notebook 上で Python コードを動かすための 専用 VM を作成します。
VM を作成すると、課金が発生します。これは、Basic/Enterprise 共通の内容です。
VM の料金については、Azure Machine Learning の価格 を参照してください。

メニューより、[管理] -> [コンピューティング] を選択します。
[コンピューティング] 画面にて、[Notebook VM] タブを選択し、[新規] を選択します。

[新しいノードブック VM] ウインドウが開きます。
以下の情報を入力し、[作成] を選択します。

入力
- ノートブック VM 名: <任意のノートブック VM 名>
- VM の種類: <作成する VM のサイズ>

VM のデプロイ完了後、状態が [実行中] になっていることを確認します。

2020/02/04 追記

現時点で Notebook VM を以下のリージョン以外で作成した場合、画面上に [レガシ] という表示が出ます。

  • North Central US
  • East US 2
  • North Europe
  • UK South

これは、Notebook VM が新しく、Azure Machine Learning コンピューティングインスタンス にサービス内容を変更していっていることが原因です。日本リージョンでは、現時点ではまだコンピューティングインスタンスに対応していないため、[レガシ] の表示が出る模様です。

詳細については、Microsoft Docs を参照してください。

稼働確認

メニューより、[ノートブック] を選択します。
フォルダのアイコンを選択し、新しくディレクトリを作成します。

[ユーザー ファイル]のルートディレクトリが作成されていると思いますので、その直下に [Samples] フォルダを作成します。

ファイルのアイコンを選択し、新しい Python Notebook を作成します。
以下の情報を入力し、[作成] を選択します。

入力
- ファイル名: <任意のファイル名>.ipynb
- ファイルの種類: Python Notebook
- ターゲットディレクトリの選択: 先ほど作成した Samples フォルダを選択

作成した Python Notebook のファイルが開くことを確認します。
Jupyter Notebook のセルと同じ画面が表示されます。

セルに以下のコードを入力し、実行後、正常に動作することを確認します。

operation-confirmation.ipynb
print("Hello Azure Machine Learning Notebook!")

終わりに

今回は、Azure Machine Learning 上に Notebook VM を作成して、自然言語解析を行うための Notebook 環境を作成しました。次回は、作成した Notebook 環境を使って、自然言語解析を行うためのデータ収集を行いたいと思います。

参考情報

Microsoft

SlideShare