RuntimeError: cuda runtime error (11) : invalid argument at/pytorch/aten/src/THC/THCGeneral.cpp:405
1370 ワード
エラー
解決:
エラーの原因:1、マルチGPUテスト2、PyTorchバージョンとグラフィックスカードの互換性がない
ここで私のエラーは後者のためで、私のグラフィックスカードはtesla T 4、PyTorch 0.4.1です.低コストのグラフィックスソリューションに変更できます.あるいは、pythonファイルの
torch.backends.cudnn.benchmark=True理解
デフォルトでは、このオプションはオフになっています.ほとんどのタスクでは、オンになったときにcudnnは現在の設定に基づいて最適なアルゴリズムを選択してトレーニング速度を速めることができます.しかし、最適アルゴリズムを選択するのに時間がかかる.すなわち、私たちの入力が毎回のiterateで変化すれば、benchmarkはiterateのたびに最適アルゴリズムを再選択し、かえって速度が遅くなる.訓練のたびに入力データのsizeが変わらなければ、これを開くと訓練速度が速くなります:
RuntimeError: cuda runtime error (11) : invalid argument at /pytorch/aten/src/THC/THCGeneral.cpp:405
解決:
torch.backends.cudnn.benchmark = True
(この文は一般的に主関数の最初の文に現れる)をtorch.backends.cudnn.benchmark = False
に変更します.エラーの原因:1、マルチGPUテスト2、PyTorchバージョンとグラフィックスカードの互換性がない
ここで私のエラーは後者のためで、私のグラフィックスカードはtesla T 4、PyTorch 0.4.1です.低コストのグラフィックスソリューションに変更できます.あるいは、pythonファイルの
torch.backends.cudnn.benchmark = True
をFalse
に設定すると、静的CUDA error
が得られ、エラーが報告されているが、後の動作に影響を与えない.torch.backends.cudnn.benchmark=True理解
デフォルトでは、このオプションはオフになっています.ほとんどのタスクでは、オンになったときにcudnnは現在の設定に基づいて最適なアルゴリズムを選択してトレーニング速度を速めることができます.しかし、最適アルゴリズムを選択するのに時間がかかる.すなわち、私たちの入力が毎回のiterateで変化すれば、benchmarkはiterateのたびに最適アルゴリズムを再選択し、かえって速度が遅くなる.訓練のたびに入力データのsizeが変わらなければ、これを開くと訓練速度が速くなります:
torch.backends.cudnn.benchmark = True