Linux上でNVIDIA GPUドライバをインストールする

12521 ワード

公式ページ

  • NVIDIAドライバダウンロードhttps://www.nvidia.com/Download/Find.aspx?lang=en-us
  • NVIDIAドライバのインストールhttps://docs.nvidia.com/datacenter/tesla/tesla-installation-notes/index.html#runfile
  • NVIDIAドライバ設定手順:https://download.nvidia.com/XFree86/Linux-x86_64/510.47.03/README/installdriver.html
  • NVIDIA持続性:https://docs.nvidia.com/deploy/driver-persistence/index.html#persistence-daemon
  • NVIDIA persistenced github: https://github.com/NVIDIA/nvidia-persistenced
  • GPUドライバのインストール


    無効にする自動更新Ubuntuで


    # 1. Disable auto-update and auto-upgrade:
    echo 'APT::Periodic::Update-Package-Lists "0";' | sudo tee /etc/apt/apt.conf.d/20auto-upgrades
    echo 'APT::Periodic::Unattended-Upgrade "0";' | sudo tee -a /etc/apt/apt.conf.d/20auto-upgrades
    

    無効にするオープンソースのヌーボードライバ


    # 2. Write blacklist options for the nouveau driver (disable):
    echo "blacklist nouveau" | sudo tee -a /etc/modprobe.d/blacklist-nouveau.conf
    echo "options nouveau modeset=0" | sudo tee -a /etc/modprobe.d/blacklist-nouveau.conf
    
    # 3. Update kernel initramfs for blacklist (modprobe.d) options:
    sudo update-initramfs -u
    

    パッケージのインストール


    # 4. Clean apt package manager lists and caches:
    sudo rm -vrf /var/lib/apt/lists/* /var/cache/apt/archives/* /tmp/*
    sudo apt-get clean -y
    
    # 5. Updating, indexing, and caching apt package manager app lists:
    sudo apt-get update --fix-missing -o Acquire::CompressionTypes::Order::=gz
    
    # 6. Upgrade and reinstall OS base packages:
    sudo apt-get upgrade -y
    
    # 7. Remove old or unnecessary leftover packages:
    sudo apt-get autoremove -y
    
    # 8. IMPORTANT! Install dkms and base packages:
    sudo apt-get install -y build-essential pkg-config libglvnd-dev mesa-utils wget dkms
    

    現在のNVIDIA GPUモデルのための適切なLinuxドライバをダウンロードしてください

  • 最新の検証された安定NVIDIA GPUドライバ( NVIDIA - Linux - x 86 six 64 - *. run )このリンクからインストーラファイルを検索してダウンロードします.https://www.nvidia.com/Download/Find.aspx?lang=en-us

  • 重要!をダウンロードして.ファイルを実行する!これは、NKIDIAドライバをインストールすることができますDKMSモジュールは、本当に重要です!

  • 重要!ダウンロードしないでください.debファイル!特にカーネルヘッダー/バージョン/モジュールがアップグレードされるとき、それは結局カーネルを壊します.したがって、時には他のアプリケーション依存(依存関係の地獄)と衝突することもあります.
  • コマンドラインインターフェイスを使用している場合は、ダウンロードリンクをダウンロードしてwgetをダウンロードしてください.例えば、
  • mkdir -v ~/Downloads
    cd ~/Downloads
    
    # 9. (Skip this, if you've already downloaded) Download appropriate Linux driver for current NVIDIA GPU model
    wget https://us.download.nvidia.com/[GPU_MODEL_TYPE_URL]/NVIDIA-Linux-x86_64-[DRIVER_VERSION].run
    # For example:
    wget https://us.download.nvidia.com/XFree86/Linux-x86_64/510.54/NVIDIA-Linux-x86_64-510.54.run
    

    NVIDIA GPUドライバをインストールする前に準備ステップ


    [重要]コンソール環境にGUI環境を変更する

  • GUI環境を使用していなくて、コンソール環境またはSSHをすでに使用していないならば、このステップを11に飛ばしてください

  • ヒント:ここからコンソール環境に入りますので、いくつかのテキストファイルでコマンドラインやメモを読むために以下のコマンドを書きます.
  • GUI環境を仮想コンソール環境に変更するには、これらのキーボードボタンを押してください.
  • またはLinuxコマンドを入力します.
  • # 10. IMPORTANT! Entering into virtual console environment:
    sudo chvt 1
    # Or:
    sudo chvt 3
    
  • コンソール環境にログインするユーザー名とパスワードを入力します
  • NVIDIA GPUドライバのインストールを準備するためにGUIプロセスを停止する


    # 11. Stop GUI service (lightdm/gdm/gdm3/kdm/slim/etc..):
    sudo service lightdm stop
    # Or:
    sudo service gdm stop
    # Or:
    sudo service gdm3 stop
    
    # 12. Initialize and refresh console environment without X11 (GUI) processes:
    sudo init 3
    
    # Change directory to NVIDIA-Linux-x86_64-***.run driver downloaded directory. For example:
    cd ~/Downloads
    
    # 13. Change permission of NVIDIA-Linux-x86_64-***.run driver installer file to executable:
    chmod +x ./NVIDIA-Linux-x86_64-[DRIVER_VERSION].run
    # For example:
    chmod +x ./NVIDIA-Linux-x86_64-510.54.run
    

    nvidiaドライバをインストールします。ファイルを実行する


  • 重要!(-- DKMS ) NVIDIAドライバを将来のカーネルアップグレードのためにDKMSに登録します.

  • 重要!(- no - X - check ) X 11 Configチェッカーを無効にし、X 11 ( GUI )プロセスを起動してドライバをインストールします.

  • 重要!(- no ccバージョンチェック) C/C++バージョンチェッカーを無効にすると、DKMS C/C++バージョンが現在インストールされているC/C++バージョンと一致しない場合にインストールエラーが発生しません.
  • # 14. IMPORTANT! Install nvidia driver with appropriate arguments:
    sudo ./NVIDIA-Linux-x86_64-[DRIVER_VERSION].run --no-x-check --no-cc-version-check --dkms
    # For example:
    sudo ./NVIDIA-Linux-x86_64-510.54.run --no-x-check --no-cc-version-check --dkms
    
  • 警告メッセージに「継続してインストール」を選択します.

  • 重要!DKMSカーネルモジュールのレジスタの' yes 'を選択します.
  • 32ビット互換性のインストールのための' no 'を選択するか、32ビット互換性エラーが表示されたときに「OK」を選択します.

  • 重要!自動的にあなたのX設定ファイルを更新するように頼むとき' no 'を選択します.
  • # 15. Remove downloaded file:
    rm -vf ./NVIDIA-Linux-x86_64-[DRIVER_VERSION].run
    # For example:
    rm -vf ./NVIDIA-Linux-x86_64-510.54.run
    
    # 16. Reboot system:
    sudo shutdown -r now
    
    # 17. Check nvidia driver is installed:
    nvidia-smi
    

    インストール後


    [ ML / DLサーバのみ]設定


    推奨されません:X 11/ウェイランドプロセス(GUIレンダリング用)で使用されるGPU.
    # Install git to clone:
    sudo apt-get install -y ssh git
    
    # Download nvidia-persistenced source code from github:
    git clone https://github.com/NVIDIA/nvidia-persistenced.git
    
    # Install nvidia-persistenced service daemon:
    cd nvidia-persistenced/init
    sudo ./install.sh
    
    # Remove downloaded files:
    cd ../.. && rm -rf nvidia-persistenced
    
    # Check nvidia-persistence mode is ON:
    nvidia-smi
    # Or check nvidia-persistenced.service is running:
    systemctl status nvidia-persistenced.service
    
    👍 ✨

    インストール完了


    [オプション] NVIDIA GPU監視ツールをインストールします


    🌟📡 硝子体


    # Install python3 and pip3 packages:
    sudo apt-get install -y python3 python3-pip
    
    # Install nvitop into system python3 packages:
    sudo pip3 install nvitop
    
    # Check nvitop:
    nvitop -m full
    
  • https://pypi.org/project/nvitop
  • https://github.com/XuehaiPan/nvitop
  • 📊 国立天文台


    # Install cmake, ncurses and git:
    sudo apt-get install -y cmake libncurses5-dev libncursesw5-dev
    
    # Download nvtop source code from github:
    git clone https://github.com/Syllo/nvtop.git
    mkdir -vp nvtop/build && cd nvtop/build
    
    cmake ..
    # If it errors with "Could NOT find NVML (missing: NVML_INCLUDE_DIRS)"
    # try the following command instead, otherwise skip to the build with make:
    #cmake .. -DNVML_RETRIEVE_HEADER_ONLINE=True
    
    make
    sudo make install
    
    # Remove downloaded files:
    cd ../.. && rm -rf nvtop
    
    # Check nvtop:
    nvtop
    
  • https://github.com/Syllo/nvtop
  • NVIDIAドライバを最新バージョンに再インストールまたはアップグレードする


    dkms nvidiaモジュールを削除する


    DKMSでNVIDIAドライバをインストールしなかった場合は、この手順を飛ばしてください.
    # Check current dkms nvidia modules, versions, and kernels:
    # [TIP]: Use module versions to remove.
    dkms status | grep nvidia
    
    # Remove old dkms nvidia module/version:
    sudo dkms remove nvidia/[DRIVER_VERSION] --all
    # For example:
    sudo dkms remove nvidia/510.54 --all
    

    サービスを無効にする


    NVIDIA持続デーモンを設定しない場合は、この手順をスキップします.
    # Stop and disable nvidia-persistenced service daemon:
    sudo systemctl stop nvidia-persistenced.service
    sudo systemctl disable nvidia-persistenced.service
    

    すべてのNVIDIAパッケージをアンインストールする


    sudo apt-get remove --purge '^nvidia-.*'
    # Or:
    sudo nvidia-uninstall
    
    # Reboot system:
    sudo shutdown -r now
    

    最新のNVIDIAドライバ版をインストールしてください


    NVIDIAドライバを再びインストールします.#install-nvidia-gpu-driver