Failed to get convolution algorithm. This is probably because cuDNN failed to initialize

1642 ワード

注意すべき点:
  • 環境構成の問題をチェックし、tensorflow、cuda、cudnnバージョンは公式サイトの要求に従って対応する公式サイトのバージョンに対応しなければならない.

  • CUDAバージョンcat /usr/local/cuda/version.tst cuDNバージョンcat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2 cuDNインストールを表示する:(公式サイトでインストールパッケージをダウンロードし、登録する必要がある)
    cp cudnn-10.0-linux-x64-v7.4.2.24.solitairetheme8 cudnn-10.0-linux-x64-v7.4.2.24.tgz
    sudo tar -xzf cudnn-10.0-linux-x64-v7.4.2.24.tgz -C /usr/local 
    
  • tensorflowのCPUバージョンとtensorflowのGPUバージョンは同時に存在しないで、CPUバージョンのアンインストールpip uninstall tensorflow、インストールGPUバージョンpip install tensorflow-gpu==
  • tensorflow-gpuの再ロードを試み、アンインストールせずに直接再ロードします.
  • 他のブログによると、linuxの下のjupyterはrestart kernelを試してみることができるという.
  • が実行するコードにint型のデータを使用するかどうか、gpuはfloat 32型のデータをサポートし、reshapeなどの操作GPUは加速せず、sum操作GPUはCPUより
  • 遅い.
  • に問題があります.nvidia-smiを使用してGPUステータスを表示できます.(topまたはps -ef CPUの状態を表示可能)
  • import os
    os.environ['CUDA_VISIBLE_DEVICES']='0'
    config = tf.ConfigProto()
    config.gpu_option.per_process_gpu_memory_fraction=0.9 #90%  
            :config.gpu_options.allow_growth=True #GPU     
            :
    sess = tf.Session(config=config)
    

    まだ問題がある場合は、反復するたびにデータを何回かに分けて処理するなど、処理ごとのデータを減らすことをお勧めします.一度に処理するデータ量が大きすぎると、エラーも発生します.