Microsoft NNI入門——インストール
1756 ワード
NNIと他の自動機械学習ツールの比較、NNIインストールプロセスの体験、NNI使用プロセスの体験、NNIに対する提案NNIと他の自動機械学習ツールの比較、NNIインストールプロセスの体験、NNI使用プロセスの体験、NNIに対する提案
インストール体験
NNIがインストールしたドキュメントは比較的全面的で、まず実験室の機械に環境のインストールを行い、すべてが順調に見え、簡単にインストールできました.その後、ノートパソコン(MacBookPro)にインストールを行い、多くの問題に遭遇し、一緒に参加した先輩からのフィードバックによると、ノートパソコンはグラフィックスカードがない場合、MNistを走るのはカードだという.その後、実験室の機械はイントラネット接続しかできないので、クラウドサーバーを申請して試験を行い、Ubuntuシステムを持って、P 100を持っていて、インストール時に何の問題もなく、とても簡単です.
インストールプロセス
pythonライブラリのインストール
githubからコードをダウンロードしてインストール
インストールで発生したtensorflowの問題
TensorFlowをインストールするときにいくつかのcudaバージョンが対応していない問題に遭遇しました.サーバー自体の環境はcuda 9.1で、TensorFlowがバージョンを指定しない、つまり最新バージョンをインストールしようとしたばかりで、実行するときにTensorFlowバージョンが高すぎるという問題に遭遇しました.9.2以上のcudaが使用できることに気づきました.そのため、実行するとdriverバージョンが足りないことを提示します.CUDA付きバージョンが足りないため、tfのバージョンを下げます.tensorflow-gpu=1.8.0 cudatoolkit-9.0 cudnn-7.3.1も1.6.0バージョンを試したことがありますが、理論的には問題ないと思いますが、何度もCuDN 7.1.3を呼び出していますが、CuDNN 7.0.5のみがインストールされています.前の操作に加え、condaの依存リストには対応バージョンの操作が自動的に再インストールされないため、エラーが発生し、最後に1.8.0バージョンを選択しました.またcondaにcudnnをインストールする場合は、conda環境下で、本来のcudnnバージョンには影響しませんし、本来もcudnnをインストールしていないこととは関係ありません.
その後、アリ雲のサーバーが停止したことに気づいても料金を徴収し続け、千以上を差し引いたとき、私はやっとこの問題を発見しました.急いで工単を提出してカスタマーサービスに聞いて、地元のストレージを持っているすべての機械が停止してからお金を受け取らないことを教えてくれました.それは穴ではありませんか.これはまったく量払いではないでしょうし、最初から最後までヒントもなく、腹立たしいですね.そして、すべてのP 100はローカルストレージです.
CentOSインストール
CentOSインストールの場合、ソースコードがインストールされている場合、コマンドreact-scripts-ts-antdが見つからないというエラーが発生しますが、pythonをそのまま使用してインストールすればよいのです.Ubuntuならapt-getでもいいです.
インストール体験
NNIがインストールしたドキュメントは比較的全面的で、まず実験室の機械に環境のインストールを行い、すべてが順調に見え、簡単にインストールできました.その後、ノートパソコン(MacBookPro)にインストールを行い、多くの問題に遭遇し、一緒に参加した先輩からのフィードバックによると、ノートパソコンはグラフィックスカードがない場合、MNistを走るのはカードだという.その後、実験室の機械はイントラネット接続しかできないので、クラウドサーバーを申請して試験を行い、Ubuntuシステムを持って、P 100を持っていて、インストール時に何の問題もなく、とても簡単です.
インストールプロセス
pythonライブラリのインストール
python3 -m pip install --upgrade nni
githubからコードをダウンロードしてインストール
git clone -b v0.5.1 https://github.com/Microsoft/nni.git
インストーラsh install.sh
が実行されると、nnictlなどのツールnnictl create --config nni/examples/trials/mnist/config.yml
が呼び出され、デフォルトの8080ポートからWebUIインタフェースにアクセスできます.インストールで発生したtensorflowの問題
TensorFlowをインストールするときにいくつかのcudaバージョンが対応していない問題に遭遇しました.サーバー自体の環境はcuda 9.1で、TensorFlowがバージョンを指定しない、つまり最新バージョンをインストールしようとしたばかりで、実行するときにTensorFlowバージョンが高すぎるという問題に遭遇しました.9.2以上のcudaが使用できることに気づきました.そのため、実行するとdriverバージョンが足りないことを提示します.CUDA付きバージョンが足りないため、tfのバージョンを下げます.tensorflow-gpu=1.8.0 cudatoolkit-9.0 cudnn-7.3.1も1.6.0バージョンを試したことがありますが、理論的には問題ないと思いますが、何度もCuDN 7.1.3を呼び出していますが、CuDNN 7.0.5のみがインストールされています.前の操作に加え、condaの依存リストには対応バージョンの操作が自動的に再インストールされないため、エラーが発生し、最後に1.8.0バージョンを選択しました.またcondaにcudnnをインストールする場合は、conda環境下で、本来のcudnnバージョンには影響しませんし、本来もcudnnをインストールしていないこととは関係ありません.
その後、アリ雲のサーバーが停止したことに気づいても料金を徴収し続け、千以上を差し引いたとき、私はやっとこの問題を発見しました.急いで工単を提出してカスタマーサービスに聞いて、地元のストレージを持っているすべての機械が停止してからお金を受け取らないことを教えてくれました.それは穴ではありませんか.これはまったく量払いではないでしょうし、最初から最後までヒントもなく、腹立たしいですね.そして、すべてのP 100はローカルストレージです.
CentOSインストール
CentOSインストールの場合、ソースコードがインストールされている場合、コマンドreact-scripts-ts-antdが見つからないというエラーが発生しますが、pythonをそのまま使用してインストールすればよいのです.Ubuntuならapt-getでもいいです.