問題レコード|ubuntu 18.04+cuda 9.0+cudnnサーバtensorflow-gpu深さ学習環境の構成

2354 ワード

実験室のサーバーの資源が限られているため、私が割り当てられたサーバーはいつも変化していますが、ビデオカードの駆動とcudaさえ入っていないサーバーに分かれていることがよくあります.本当に頭が痛いです.私はもう4、5台を持っています.これを記録して、後で直接バージョン通りにインストールします.
Install nvidia driver
私のサーバー構成はubuntu 18.04で、グラフィックスカードは1080 Tiです.
ubuntuにドライバのソースを追加するには:
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt update
sudo apt upgrade

デバイスのモデルを参照してください.推奨されるドライバのモデルを参照してください.
ubuntu-drivers devices

グラフィックスドライブの自動インストール
sudo ubuntu-drivers autoinstall

再起動
sudo reboot

再起動がうまくいけばチェックを命令します
lsmod | grep nvidia

or
nvidia-smi

Install CUDA9.0 and cudnn7
CUDAバージョンの表示:
cat /usr/local/cuda/version.txt

CUDNNバージョンの表示:
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2

ダウンロードして9.0.176_384.81_linux.run
リンク:https://developer.nvidia.com/compute/cuda/9.0/Prod/local_installers/cuda_9.0.176_384.81_linux-run
ubuntu 16.04バージョン:https://developer.nvidia.com/compute/cuda/9.0/Prod/local_installers/cuda_9.0.176_384.81_linux-run
インストールcuda:
sudo chmod 777 cuda_9.0.176_384.81_linux.run
sudo ./cuda_9.0.176_384.81_linux.run -toolkit -samples -override --no-opengl-libs -silent

gccバージョンの変更
sudo apt install gcc-5 g++-5
sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-5 50 
sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-5 50

cuda環境変数の設定
vim ~/.bashrc1
export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64:/usr/local/cuda/extras/CPUTI/lib64
export CUDA_HOME=/usr/local/cuda-9.0/bin
export PATH=$PATH:$LD_LIBRARY_PATH:$CUDA_HOME

cudnnをダウンロードするにはhttps://developer.nvidia.com/rdp/cudnn-archiveリンクからダウンロードを選択
cudnnライブラリをcudaにコピー
tar -zxvf cudnn-9.0-linux-x64-v7.tgz
sudo cp cuda/lib64/* /usr/local/cuda-9.0/lib64/
sudo cp cuda/include/* /usr/local/cuda-9.0/include/

tensoflow-gpu-1.14をインストールします.
pip install -U tensorflow-gpu -i https://pypi.tuna.tsinghua.edu.cn/simple --user

tensorflowテストプログラム:
import tensorflow as tf
sess = tf.Session(config=tf.ConfigProto(log_device_placement=True))